如何衡量差变

Hongyang

声明:1)本文是SPC系列原创之三,转载须经作者同意并包括原文链接 2)【】中数字是文末参考文献号 3)不妥及争议之处欢迎留言探讨 前面两篇文章讲了<a href="https://www.meipian.cn/3zj1dkkq?share_depth=1" target="_blank" class="link"><i class="iconfont icon-iconfontlink"> </i>什么是差变(variation)和差变性(variability)</a>以及<a href="https://www.meipian.cn/4dyx58is?share_depth=1" target="_blank" class="link"><i class="iconfont icon-iconfontlink"> </i>差变的两种类型</a>,并指出“产品质量管理的本质则是控制和降低生产工艺中的差变”,也就是说,控制差变即是控制质量。欲要控制差变,就要对差变的大小进行衡量。这篇文章将阐述如何衡量差变的大小。<div><br><div>差变(variation)和差变性(variability)总是通过工艺或过程(process)的输出(产品)得以体现【1】。因此,对工艺输出产品的测量就是衡量工艺之差变。注意:工艺或过程对应的是同一个英文词Process,本文基于不同语境选择使用过程或工艺,例如:起草SOP的process称为过程;而片剂的压片process则被称为工艺。<br><br>理解process的理念对于理解差变之控制十分重要。世界上任何一件事情都可以被认为是一个过程,它总是包括一些输入和一些步骤或操作,这些步骤或操作将输入变成输出。例如,写一个字母a是一个过程,其输入包括笔、纸、人手的动作,其输出则是手写字母a。开车上班也是一个过程,其输入是驾驶人、车(包括汽油或电)、道路、交通状况,其输出则是安全到达公司。同理,工作中的每一件事都是一个工艺或过程,其输出则是产品或服务。如果工作的内容是服务,通常其过程即是产品,一个典型的例子是培训或教学---学生不是教学的输出,其考试分数也不完全是教师教学过程的输出结果。<br><br>如果说衡量一个工艺过程之差变就是对该工艺输出产品的测量,那么问题就转化为用什么指标来衡量一个工艺的输出产品?答案是产品的质量属性。上述开车上班的例子中,达到公司所用的时间(注意不是达到公司的时间)则是该过程的一个质量属性。一个工艺的输出产品有许多质量属性。每天开车上班的油耗可以是开车上班过程的另一个质量属性。毕竟,质量属性才是控制质量时所关注的。测量产品质量属性的本身就是在衡量工艺输出的差变性。实际上,舒哈特Shewhart就是在测量和分析产品质量属性的数据时,发明了差变这个重要的概念【1】。也正是鉴于此,工艺之差变往往被表达为产品质量之差变(variation of product quality)。产品质量控制也往往被认为是对产品质量属性差变的控制。笔者认为,这种表达在某种意义上形成了长期的产品质量管理误区—即注重产品检验结果,忽视工艺控制这个根本(当设计已经给定时)。近二三十年强调对工艺的理解和控制,才是回归根本。<br><br>制药人都非常熟悉产品质量属性及其测试。公司QC实验室每天都在进行产品质量属性的测量,并产生出大量的数据。这些结果很多都可以用来衡量制药工艺的输出,即产品质量之差变性。值得注意的是并非所有的产品质量属性都可以代表生产工艺的差变性,例如片剂产品鉴别的测试数据就和压片工艺的差变没有丝毫关系。<br><br>有了数据就可以采用统计学的工具对差变进行衡量。不过在解释将数据进行统计学分析之前,让我们先对数据的特性做一些介绍。<br><br>理解数据的类型和特征对于掌握统计学工艺控制(SPC)至关重要,因为数据的类型会决定所采用的统计学工具,而且不同的数据类型也具有不同的特征。数据通常分为两大类,一类是连续变量数据或被称为计量型数据,如重量、体积、面积、长度、含量,水分、相关物质等等;另一类是离散变量数据或被称为计数型数据,包括偏差数目、合格批次数、次品数、OOS数目、客户投诉数、订单超时数、上班迟到天数等等。实验室测试的数据不外乎这两类数据。<br><br>数据总是产生于某个测量系统,即便是目测、数数、判断颜色或气味也是一种测量系统。由于对质量属性所测量的数据即代表工艺之差变,因此,差变的大小总是与测量系统之准确性(accuracy)和精确性(precision)密切相关。实际上,任何一个质量属性的测试结果均体现着工艺差变和测量过程差变之和。这也是有些测量结果可能不代表工艺之差变的原因(关于测量系统准确性和精确性以及测量系统的可控性的解释留待后续的文章)。<br><br>一组数据,无论是那种类型,均可以用简单的统计学方法来描述,这是SPC的科学基础。一组数据的统计学描述包括其分布(distribution)及其均值(mean)和标准差(standard deviation)。这是用于衡量差变之大小的重要指标。但是,仅仅采用分布的均值和标准差不足以全面准确地衡量差变,因为它们不能够体现数据的时间特征。<br><br>数据的时间特征是指其分布是否会随着时间而改变。在SPC的语境中,数据分布也被称为形状(shape),其均值也被称为位置(location),而其标准差则被称为范围(range)【2】。如下图所示,图一所示分布的标准差没有随时间发生改变,但位置产生了变化;图二的形状则随时间变化,但位置却没有发生改变。<br></div></div> 图一 图二 需要指出的是,只有连续变量数据具有上述的特征。离散型数据没有这样的特征,即离散型数据之位置和范围总是同时发生变化,如下图显示投掷3枚硬币和6枚硬币的字或面的结果【2】: 至此,读者们可能已经想到了,可以采用数据分布之均值和标准差来衡量差变的大小。最简单的方法就是采用频度分布图,即直方图(histogram)来显示差变之大小。制作直方图极其简单。例如,称量从压片机取出的20个药片的片重,将结果取整,标注在一个数轴上,如图所示,每一个“X”代表一片的重量。显而易见,图三所对应的20片的片重差变大于图四所对应的20片的片重差变。 图三 图四 然而,仅仅采用均值和标准差并不能完整地衡量差变的大小,因为它们不能够体现出数据之时间属性。欲要体现数据的时间属性,就需要启用质量管理鼻祖,休哈特Shewhart,在大约100年之前发明的工艺控制图(control chart)。<br><br>什么是控制图?如何采用控制图来衡量差变?请关注下一篇关于SPC的文章。<br> 参考文献:<br>【1】Joseph M. Juran: Juran’s Quality Handbook, 5th Edition, McGraw-Hill, 1998<br>【2】John McConnell, Analysis and Control of Variation, 4th Ed., Quantum House Ltd., 1987, ISBN 095883240<br>