科研星球

格拉布斯(Grubbs)和ROUT法有什么区别?

简言之,根据高斯分布对数据进行抽样。大多数情况下均有添加异常值(根据具有特定限制的均匀分布得出)。对每项实验设计模拟25,000次后,列出了零个、一个、两个或两个以上异常值的模拟次数。


当没有异常值时,ROUT检验和Grubbs检验的表现基本相同。为ROUT方法指定的Q值等于你为Grubbs检验设置的α值。

当有一个异常值时,Grubbs检验能够较容易检测到该值。ROUT方法具有更高的漏报率和误报率。换言之,即使模拟只包含一个异常值,该方法也更有可能遗漏异常值,并且更有可能发现两个异常值。这并不令人意外,因为Grubbs检验的目的就是检测一个异常值。尽管两种方法之间的差异很明确,但并不显著。

当在一个小数据集中包含两个异常值时,ROUT检验表现更好。Grubbs迭代检验会受到遮蔽的影响,而ROUT检验则不然。遮蔽是否是个问题取决于样本量以及异常值与其他值平均值的偏离。在非常有可能发生遮蔽的情况下,ROUT检验 显著优于 Grubbs检验。例如,当n = 10且有两个异常值时,Grubbs检验从未发现这两个异常值,并且在98.8%的模拟中两个值均遭到遗漏(在剩余的1.2%模拟中,Grubbs检验发现了两个异常值中的其中一个)。相比之下,ROUT方法在92.8%的模拟中识别出两个异常值,而在6%的模拟中遗漏两个异常值。

总结:
  • Grubbs检验略优于ROUT方法,专为以下任务而设计:从高斯分布中检测单个异常值。

  • 在某些情况下,就检测两个异常值而言,ROUT法要比Grubbs迭代检验好得多。


参考文献:
  • Motulsky HM和Brown RE,在用非线性回归拟合数据时检测异常值 - 一种以鲁棒非线性回归和错误发现率为基础的新方法,《BMC生物信息学》(2016),7:123。

    下载自http://www.biomedcentral.com/1471 - 2105/7/123。


没有账号?