统计学在医学的主要作用是(医学SCI论文统计学处理与方法选择)
strong>对大量的数据进行必要的统计学分析,并将统计的结果展现在论文中用于论证文章的观点和理论。这是一篇医学论文中统计学应用最常见的情况。先分类后统计的数据称为统计数据,如甲组30例,乙组32例,阳性率和治愈率可根据研究目的计算。用于测量特定值的数据称为测量数据,例如身高、体重、脉搏、血压和许多其他物理诊断和测试结果。方差齐次后,使用T检验或方差分析,但如果不满足上述要求,则使用秩和检验。
那么,关于医学SCI论文统计学处理与方法的选择,我们应该注意哪些内容?
1、关于统计处理
在统计处理中,我们必须首先了解研究数据是计数数据还是测量数据。虽然这是一个常识性的问题,但许多作者仍然感到困惑。先分类后统计的数据称为统计数据,如甲组30例,乙组32例,阳性率和治愈率可根据研究目的计算。用于测量特定值的数据称为测量数据,例如身高、体重、脉搏、血压和许多其他物理诊断和测试结果。
在论文的医学研究中,统计数据最常用的统计方法是T检验,测量数据最常用的方法是T检验。在研究和设计时,我们应该根据研究数据的特点来决定假设检验的方法。在处理数据时,由于均值和标准差是用来描述正态分布数据的集中和分散趋势的指标,是否用均值和标准差来描述研究数据的分布特征首先取决于数据是否正态分布。如果数据不是正态分布或者方差是不均匀的,对数据应该进行转换,使其符合正态分布。方差齐次后,使用T检验或方差分析,但如果不满足上述要求,则使用秩和检验。
一些研究数据非常庞大,所以我们只能将对图像的P值与表中描述的a . 拉伯数或特殊符号(如P0.05、P0.05和P0.01)进行表达和比较,而不能一一给出具体的P值。然而,有些作者既没有解释所用的统计方法,也没有给出具体的P值,而是直接列出了P0.05或P0.05,并认为这种差异在统计上是否显著,这使得读者对无法判断结果的可靠性。
论统计方法的选择
一、两组或多组测量数据的比较
1.两组数据:
1)大样本数据或正态分布的小样本数据
(1)如果方差是同质的,进行分组t检验
(2)如果方差不一致,将使用t检验或威尔科克森秩和检验
2)对于小样本偏态分布数据,使用威尔科克森秩和检验
2.多组数据:
1)如果大样本数据服从正态分布且方差是齐次的,则方差分析是完全随机的。如果方差分析的统计检验具有统计学意义,则进一步选择合适的方法(如LSD检验、Bonferroni检验等)。)进行成对比较。
2)如果小样本的偏态分布数据或方差不一致,将进行克鲁斯卡尔沃利斯的统计检验。如果克鲁斯卡尔沃利斯的统计检验具有统计显著性,则进一步选择适当的方法(如分组的威尔科克森秩和检验,但用邦费罗尼法来校正P值等。)进行成对比较。
2.分类数据的统计分析
1.单样本数据和总体比较
1)二分类数据:
(1)当样本较小时,二项分布用于精确概率检验;
(2)对于大样本:使用u检验。
2)多分类数据:皮尔逊c2检验(也称为拟合优度检验)。
2.四格表数据
1)n40,所以理论值大于5,使用皮尔逊c2
2)n40,因此理论数大于1并且至少有一个理论数5,然后使用修正的c2或费希尔精确概率方法进行测试
3)如果n40或理论值1存在,则使用费希尔检验
3 .统计分析。2C表数据
1)如果列变量是一个效果指数,一个有序的多分类变量,而行变量是一个分组变量,那么行得分的CMH c2或组的威尔科森秩和检验。
2)如果列变量是效果指标,而二分类,和列变量是有序多类变量,则使用趋势c2检验
3)行变量和列变量都是无序分类变量
(1)如果1)n40和理论数小于网格数行列表中网格总数的25%,则使用皮尔逊c2
(2)在理论数小于5的网格数行列表中,如果有40或25%的网格,则使用费希尔精确概率方法进行检验
4.表格数据的统计分析
1)如果列变量是效果指数,有序多分类变量和行变量是分组变量,则CMH c2或克鲁斯卡尔沃利斯的秩和检验
2)列变量是效果指标,是无序的多分类变量,行变量是有序的多分类变量
(1)如果1)n40和理论数小于网格数行列表中网格总数的25%,则使用皮尔逊c2
(2)在理论数小于5的网格数行列表中,如果有40或25%的网格,则使用费希尔精确概率方法进行检验
3.两组或多组测量数据的比较
1.两组数据:
1)分布对差服从正态分布的大样本数据或小样本数据应与对t检验相匹配
2)如果样本很小且差异是偏态分布数据,则威尔科森符号与对秩检验相匹配
2.多组数据:
1)如果大样本数据或残差服从正态分布且方差是齐次的,则进行随机分组的方差分析。如果方差分析的统计检验具有统计学意义,则应进行进一步的统计分析:选择合适的方法(如LSD检验、Bonferroni检验等)。)进行成对比较。
2)如果差异是偏态分布数据或在小样本中方差是不均匀的,将进行弗雷曼统计检验。如果弗莱德曼的统计检验具有统计显著性,则进行进一步的统计分析:选择合适的方法(如威尔科克森符号匹配对秩检验,但使用邦费里尼方法校正P值等)。)进行成对比较。
4第四,回报分析
1.直线回归:如果回归分析中的残差服从正态分布(大样本不要求正态性),并且残差与自变量之间没有趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则,应进行适当的变换以满足上述条件。
2.多元线性回归:因变量(y)是连续变量(即测量数据),自变量(X1,X2,…,Xp)可以是连续变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本不要求正态分布),并且残差和自变量之间没有趋势变化,则可以得到多重线性回归。
1)观察性研究:主要影响因素可以通过逐步线性回归找到
2)实验研究:除了主要研究因素变量(干预变量)外,还可以适当引入一些其他可能的混杂因素变量,以纠正这些混杂因素的对结果的混杂效应
3.二分类:的逻辑回归因变量是二分类变量,自变量(X1,X2,…,Xp)可以是连续变量,有序分类变量或二分类变量。
1)非匹配对:无条件物流退货
(1)观察性研究:主要影响因素可以通过逐步线性回归找到
(2)实验研究:除主要研究因素变量(干预变量)外,还可以适当引入一些其他可能的混杂因素变量,以纠正这些混杂因素的对结果的混杂效应
2)匹配对:条件逻辑回归
(1)观察性研究:主要影响因素可以通过逐步线性回归找到
(2)实验研究:除主要研究因素变量(干预变量)外,还可以适当引入一些其他可能的混杂因素变量,以纠正这些混杂因素的对结果的混杂效应