每一位研究者,可能都有一颗降低样本量的心。

其实在样本量计算的一般考虑与注意事项 (trialstats.com)中,哪些因素可以影响样本量的计算结果,已经说得很清楚了。

这里说说这些参数的设置,如何影响样本量的大小

1、检验水准(α):一般就是双侧0.05/单侧0.025了,非要设置成0.01,样本量的计算结果会增大

2、检验效能(Power=1-β):设置到80%的水平就不能再低了;Power越大,需要的样本量越多

3、如果两组比较(其它情况类似),在其它参数水平不变的情况下,两者差异越大,需要的样本量越小;反之就越大;

4、对于计量资料,数据的变异(标准差/方差)越大,在其它条件不变的情况下,需要的样本量就越多,反之,如果标准差/方差很小,则样本量的计算结果就会较小

5、一般计量资料的非劣效检验,界值(负值)的绝对值越大,相同条件下的样本量计算结果就越小;如果是优效性检验,则界值(正值)越大,需要的样本量就越多;

6、生存分析的样本量计算一般需要风险比(HR),非劣效界值(HR>1)越大样本量越小;优效性界值(HR<1)越小,样本量越大。

说在最后

样本量的计算,本来是研究开始前的一项设计工作,现在更多地可能成了一些研究者的累赘,想尽办法要把样本量这个数字降下来,当然,出于现实的考虑这也没有什么,这样的申办者和研究者我也遇到了很多,可以理解。

但是话说回来,样本量的规模,与研究结果的可靠性密切相关。在同样条件下,规模越大的研究,也越值得依赖,就是这个道理。

所以,多大的样本量才是刚刚好?既不使研究规模过大,也不会有太低的Power,我想这就是所谓的QbD的原则之一吧。