首页 理论教育稳定性的多重比较统计方法及样本量确定

稳定性的多重比较统计方法及样本量确定

【摘要】:对于稳定性试验所获得不同保管条件下不同考察周期的样品测试结果,通常需要利用统计方法检验其准确度是否发生了显著变化。通常,稳定性检验的统计方法包括t检验法、多重比较法等。按照多重比较统计方法进行稳定性试验设计和结果评价时,首先需要确定每个处理中所需样本份数。

对于稳定性试验所获得不同保管条件下不同考察周期的样品测试结果,通常需要利用统计方法检验其准确度是否发生了显著变化。通常,稳定性检验的统计方法包括t检验法、多重比较法等。

t检验法中,可以通过两种方式实现。一是通过一定考察周期后系列测量结果算术平均值与已知原样品中目标分析物的标准值(或参考值)进行一致性检验,简称“参考值一致性比较”,此时,t统计量按照式(2-33)进行计算,若t统计量小于自由度为(fni-1)及给定显著性水平a(通常a=0.05)的临界值taf,说明此考察周期内稳定,反之不稳定;二是通过一定考察周期后测量结果与最初一次的测试结果进行两个平均值一致性检验,简称“两个均值一致性比较”,此时,t统计量按照式(2-34)进行计算并进行检验,若t统计量小于自由度为(fni+n0-2)及给定显著性水平a(通常a=0.05)的临界值taf,说明此考察周期内稳定,反之不稳定。

需要注意是,在使用两个均值一致性比较的t检验法时,虽然在稳定性试验中所用的测量方法通常是相同的,即不同时期测量结果的精密度一致,但由于不同时期实验操作人员等因素的影响,还是需要在进行t检验前,对两组数据的变异性进行等精度(齐方差)检查,以确保两组测量数据的精密度无显著性差异,即采用F检验法评价两组测量数据精密度的一致性。F统计量的计算按照式(2-35)获得。若F统计量小于自由度为(v1n1-1,v2n2-1)及给定显著性水平[通常a=0.05的临界值]的临界值,则认为两组测量结果无显著性差异,反之,差异显著。

式中 ——考察周期为ini个样品测量结果的算术平均值;

μ——原样品的标准值(或参考值);

Si——ni个测量结果的标准偏差

ni——考察周期为i时测量的样品数。

式中 ——考察周期为ini个样品测量结果的算术平均值;

——最初一次n0个样品测试结果的算术平均值;

Si——ni个测量结果的标准偏差;

S0——n0个测量结果的标准偏差;

ni——考察周期为i时测量的样品数;

n0——最初一次测量的样品数。

式中 ——具有较大方差样本测量结果的方差;

——具有较小方差样本测量结果的方差。

《GB/T 10092—2009数据的统计处理和解释测试结果的多重比较》[33]所规定的多重比较统计方法是《GB/T 35655—2017化学分析方法验证确认和内部质量控制实施指南色谱分析》与《GB/T 35657—2017化学分析方法验证确认和内部质量控制实施指南 基于样品消解的金属组分分析》推荐的稳定性统计检验方法。

按照多重比较统计方法进行稳定性试验设计和结果评价时,首先需要确定每个处理中所需样本份数。其确定方法参见GB/T 10092—2009附录A的规定,按照式(2-36)计算每个处理重复测定次数及试样的总分份数。一般情况下,自由度应不小于15。假定检测4个时间间隔(4个处理),那么每个时间间隔的重复检测次数不低于5次,试样的总份数不低于20份。

式中 n——每个处理的重复检测次数;

f——要求的最小自由度;

k——处理个数。

根据GB/T 10092—2009规定多重比较统计方法程序[33],首先为保证比较不同考察周期和保存条件下处理的检测结果精密度基本相等,推荐采用科克伦(Cochran)检验法检验各处理的方差齐性,若某一处理出现方差过大时,应剔除该处理的全部数据,不参与下一步的多重比较;其次,对剔除离群值后的数据,重新计算处理的平均值和公共方差估计值;最后对多个处理的数据进行多重比较;多重比较的统计方法包括k种处理与参照处理之间的比较法(D法)、k种处理的两两比较法(T法)、几组处理均值间的比较法(S法)。若多重比较的结果表明,在检测周期内,各组分检测结果没有显著性差异,则可以得出在考察的周期内,检测对象稳定的结论;反之,在考察的周期内检测对象不稳定。