加急见刊

医学上常用的统计设计方案

来源:投稿网 时间:2024-04-22 10:00:03

1前言

医疗科学研究中,设计主要包括专业设计和统计设计两大部分。统计设计方案在近几年出现了一些重大问题[1],主要表现为统计设计方案过于简略,未能充分体现处理因素之间的作用,不恰当地运用统计设计方案,不符合目的及处理因素的水平。关于量化数据的假设检验,统计方法使用错误的最常见原因是忽略了数据相应的设计类型[2]。医疗统计学设计是开展临床医学实验的重要前提,只有做好统计设计,才能使实验用较经济的人力.物力和时间获得精确.可靠.重现性好的实验结果。要获得良好的统计设计,必须严格遵守统计设计的4条原则:对照.平衡.随机,重复性原则;再制订一套合理的统计设计方案[3],它直接影响医学期刊的质量,当前国内外对于医学统计学设计方案的研究只针对某一设计类型的应用方法进行分析,然而,统计设计在医学应用中的质量问题没有得到系统分析。因此,本文利用样本聚类的方法,对医学上常用的九种统计设计方案进行分析,通过类间、类间的对比,找出问题,并对改进研究设计有一定的参考价值。

2物质和方法。

通过对河北省图书馆及河北医科大学的馆藏,采用单随机抽样调查法抽取2000。2001、2002两年两期杂志所发表的临床医学研究论文657篇。采用抽样方法对其样本数量用率进行了计算,公式[4]:

n--需要的样本数量大小。

这次测量α=0.05,μ0.05=1.96,δ表示允许误差(也就是期望检测到的差异)。这次调查基于前一次经验值0.04,预先调整了100篇文章,其中48篇在统计设计中存在不足,因此,这个调查的p值是0.5;为了排除与此研究无关的文章,文章选取了1000篇医学论文,从基础和临床两个方面剔除了343篇非本文研究的医学论文。剩下的657篇,因此有效样本达到657篇,达到本文所需的601篇。

3统计学方法。

2.1确定指标及其分配。

本调查样本为医学上常用的统计设计类型(分组设计.成对设计.随机分区设计.交叉设计.拉丁平面设计.分析因设计.正交设计.重复测量设计和顺序设计),统计学设计方案的指标有无.不正确.不清楚且正确[5-7],其数据结果以百分比形式表示[8];本调查所采用的统计设计方案主要是:是否符合实验目的;处理因素的水平数目;区组因素数目;加工因素之间有无相互影响;非加工因素的均衡情况。指的是文中没有统计设计过程,不能遵从四条统计设计原则;错误:指论文中只写出统计设计方案,但与以上任何一方面不符;不明确:指论文中没有写明统计设计方案的具体名称,只对试验对象进行随机分配和分组,不能判定;正确:指论文上具体写出统计设计方案,并且所有的条件都符合。没有.不正确.不明确且正确的赋值是1.2.3和4。

2.2Q型聚类分析。

本研究采用了系统聚类法,聚类统计量用欧氏距离,类与类的距离定义为类平均法,SAS8.0数据处理,在聚类分析中,两个样本间的距离越小,表明两个样本的相似性越大。类间距离是一类(一组样本)和另一类(另一组样本)之间距离的统称。在令A中有a个样本,在B类中有b个样本,D(i,j)被称为A中的第i个样本与B中j个样本之间的距离,被称为D(i,j)是A类和B类中一对样本之间的距离,i=1,2,…,a;j=1,2,…,a;j=1,2…,b。假定D(A,B)是A类与B类之间的距离,这一次调查的类均法它们的类间距离相当于两个类别中所有样本对间距离的平均值,即D(A,B)={sumD(i,j)}/(ab);样例聚类分析中两类之间的类间距越大,两类的类内所有样本的性质就越不相似;相反,两者类之间的距离越小,两个类中所有样本的性质就越接近。本文提出了系统聚类的基本思想,首先把n个聚类样本看作n类,然后根据类间距离将相似度最高的两个类合并成一类。再次把所有类(包括新类)中相似性最高的两个类合并成一类,重复这一过程。直到所有的类间距离都达到一定的要求为止,或者直到所有n个样本被合并为一个类别,依据类间距离要求和实际意义选择合适的分类方法。将医学常用的统计设计方案聚类后,可进一步对类间、类内进行系统分析,以发现问题,并提醒相关人员更多关注哪种统计设计方案。

2.33年间的对比。

3类组成比的比较,三年论文的使用情况,以「2」检验,两两比较的检验水准用修正后的α',其计算公式如上,用CS2000进行检验。

四是一致性检查。

在这一过程中,一致性检验是一种重要的质量控制方法,本调查采用一致性检验,可有效地评价这一分析结果的可靠性。以kappa值表示评估指标,公式如下:

作者根据统一的评价标准对所有被评审的论文进行评审,并由一位专家评审,如果发现有意见分歧,将由双方共同分析,以便得出一致的结论。他们在657篇设计方案中获得了95.74%的评分(结果见Table1),Kappa值=0.9227,双方在657篇论文(u=35.1507,p<0.05)之间具有一致性,通过调查可以看出,657篇文章结果可靠,资料处理过程采用CS2000统计软件进行。