样本量取多少合适?样本量是不是越大越好?无论是毕业答辩,还是研究设计,样本量的问题经常困扰着不少科研伙伴们。
随着科学研究的发展,各学科对实验动物的需求量不断增长;伦理学规范也引发人们对动物福利和科学道德的重视。此外,实验动物样本数量的模棱两可甚至会导致研究结果被误读。ARRIVE(动物研究:体内实验报告)指南已明确要求动物实验报告解释实验动物所需样本量如何确定,并提供样本量估算的详细信息。
各位伙伴们,在做动物实验的你们,有没有测算过,您这次动物实验需要几只小白鼠呀!
01 为什么要进行样本量估算?
科学性要求:使研究设计更加严谨。 伦理学考虑:对于实验动物研究者应当遵循3R原则,即替代(replacement),减少(reduction)和优化(refinement)。估算实验动物的样本量则着眼于第二个R—减少(reduction)。 对可行性的评估需要:从人、时、物力等等方面对方案的可执行性进行充分的评估。
(1)样本量是不是越多越好呢?
当然不是! 因为样本量越大,实际操作难度就越大,所需试验经费就越大。 样本量大虽然可以压缩置信区间,但会不利于试验的质量控制。
(2)样本量太小呢?
样本量越小,所需要的经费越少,实际操作也越简单,但是样本量太小,会带来以下问题: 1、样本量不够会影响检验效能,导致不能发现原本存在的差异。通俗来说,就是你希望你的研究得到一个P值小于0.05的结果,但样本不够,你得不到的可能性会大大增加。 如果你一个实验,有10%的概率得不到,是可以接受,如果是30、50%呢?你还能接受吗? 2、样本量太小,甚至可能由于机遇的原因导致阴性结论。 所以在进行试验之前,我们要对样本含量进行正确地估算,来获得适当的样本量,这样可以节省大量的人力、物力、财力,同时也可以减少对实验动物造成的潜在伤害,使研究结果真实可信。
02 动物实验样本量的确定依据和计算方法
(1)确定依据(这些方法的可信度由强到弱):
1.预实验结果:可信度最高 2.文献总结情况(meta分析之类的当然最好):有的时候没做预实验,但是别人做过类似的,或者参考以前的研究结果,那就用这种方法:把别人做过的相似的研究总结一下。
(2)计算方法(针对依据1)
方法1
需要已知的最重要的参数为: 效应量(各组关键指标的均数) 标准差(各组关键指标的标准差) 一类错误概率(α)
基于F检验计算样本量
方法2
通过方差分析的自由度(E)进行估算,E的取值范围应在10-20之间,如果当计算的E小于10则说明应当增加每组的动物数量,以此提高其产生显著性水平结果的可能;当计算的E大于20时则说明估算的动物数量过多,并不能继续提高其产生显著性水平的结果的可能,造成实验动物的浪费,所以应当减少每组的动物数量。
临床研究之所以注重样本量估算,其中很重要的原因在于人群中明显的个体差异,所以充分的样本是透过样本随机误差了解总体的重要措施。在动物研究中,由于我们有机会通过纯化的种系和更加可控的实验过程实现研究对象的同质性,可比性,完成因果推断。此刻,往往并不需要和临床研究那样,对个体变异那样“敬畏有加”。以实验动物为对象的研究,其样本量的确定在很多情况下都不是通过统计学估算来决定的。
03 动物实验,每组最少可以到几只?
我来谈谈我的见解: 1、理论上,动物实验中小鼠数越多,实验结果越可靠,至少可以避免小鼠个体差异等因素。 2、但是,在动物保护组织和动物福利的倡议下,现在动物实验提倡4R(reduction、refinement、replacement、responsibilty),其中reduction减少实验动物的数量,前提是在统计学有效的情况下。 3、在理论与实际之间的矛盾下,以及在许多文献的提示下,对每组选择动物的数量没有绝对的限制,但最终一定要避免个体差异而引起错误的实验结果。 我的感觉是这样的:假设一个药物治疗的或筛选的实验。 1:检测药物治疗的效果,比如宏观的试验,检测药物的保护率之类的实验,能够从肉眼看到现象的每一组至少不能少于8只,最好10只或更多,因为这是一个大样本的实验,数量越多越真实。 2:如果通过动物实验检测药物对动物的某个指标的影响,如需要在不同的时间点检测细胞因子或相关核酸蛋白不同时间段的量的变化,这样因为需要多次取样,多次检测。 这样的话,每次感觉取3-4个样本就可以,可以不用去太多的样本,因为这是从微观上检测分子水平的含量,个人认为小样本检测应该是足够的,4只就可以了。