添加分层因素可以降低小试验的统计效力
为了确保随机临床试验的所有组中关键亚组的参与者比例大致相等,统计学家经常将患者分层分配到每个组,并在最终分析中考虑这些分层因素。
SWOG癌症研究网络的研究人员领导的一项计算研究发现,对于中等大小的人来说阶段2 .试验中,有超过一个或两个分层因素的分层分析可显著降低试验检测阳性结果的效力。
这项工作将于12月12日在新奥尔良举行的美国血液学会2022年年会和博览会上发表(ASH 2022摘要#4027)。
为了测试分层对统计能力的影响,研究人员使用一项即将完成的随机2期急性髓系白血病试验方案的设计假设来模拟试验数据。他们在设计的基础上进行了多次模拟,在随机化和分析中使用了越来越多的分层因素。然后,他们估计了每个模拟的统计能力,同时保持允许的第一类误差大致不变。也被称为假阳性,类型-1错误在实际上不存在效应时得出了一个效应。
研究人员发现,对于他们研究的小型二期试验设计,总样本量为84名参与者(每组42人),包含一到两个分层因素的分层分析与未分层设计相比,并没有显著降低统计学效力。然而,当使用4或6个分层因素时,统计效力分别从未分层环境中的88%下降到75%或55%。一般来说,临床试验设计的目标是至少有80%的能力来发现治疗组之间的差异。
这项分析是由弗雷德·哈钦森癌症中心的SWOG生物统计学家安娜·莫斯利领导的。Moseley指出,目前在文献中缺乏关于额外分层因素对统计能力影响的具体数据。
“这项实验的动力在于,在试图建议研究团队在分层中使用多少个因素时,没有任何数据可以参考,至少在第二阶段试验的设置中没有样本量小——可能有很多分层因素。”
她说,新的发现“可以帮助统计学家在设计试验时提供更明智的建议,并为限制我们的试验数量提供理由分层这些因素真的会对每个患者达到主要终点的可能性产生影响。”
“人们可能倾向于认为,我们希望手臂尽可能平等,”她补充说,“这是有道理的,因为你想要所有这些重要的因素平均地分布在武器使审判最可能是公正的,但这有一个缺点:它会影响你展示积极结果的能力。”