当前位置: 首页 精选范文 统计学变量类型范文

统计学变量类型精选(五篇)

发布时间:2023-09-28 10:11:45

序言:作为思想的载体和知识的探索者,写作是一种独特的艺术,我们为您准备了不同风格的5篇统计学变量类型,期待它们能激发您的灵感。

统计学变量类型

篇1

关键词 氯吡格雷 急性冠脉综合征 血小板聚集率 高敏C反应蛋白

目前越来越多的研究证实局部或全身慢性炎症在粥样硬化斑块的发生、发展中也起到重要作用,炎症反应的激活是造成AS斑块不稳定的重要促发因素,在ACS的发病机制中起重要作用[1]。抗血小板治疗可明显降低心脏事件发生率。常用的药物为阿司匹林和氯吡格雷。目前氯吡格雷负荷量备受关注。作为炎症标记物的CRP可能促进血栓形成和动脉粥样硬化形成[2]。本研究通过检测ACS患者血清C-反应蛋白(C-reactive protein,CRP)浓度,来探讨氯吡格雷是否可抑制AS的炎症反应,而稳定斑块,改善患者预后,以及不同剂量间的差异。

资料与方法

2008年5月~2010年8月收治ACS患者60例,男40例,女20例。入选标准:符合2007年中国心血管治疗指南和建议的急性冠脉综合征的诊断标准。凡有以下情况者予以剔除:①慢性肝、肾、免疫、血液系统疾病、恶性肿瘤、感染性疾病以及诱发血栓形成的疾病(心房颤动、风湿性心瓣膜病、周围血管疾病等);②NYHA心功能Ⅳ级;③3个月内做过经皮腔内冠脉成形术(PCI)及冠脉搭桥术(CABG)或准备行PCI或CABG治疗;④近期口服抗凝、抗血小板、止血药以及抗炎、抗氧化药物(如非甾体类抗炎镇痛药、类固醇、维生素E等);⑤有抗凝或抗血小板药物禁忌证。

试验方法:患者随机选入,入院后给予不同负荷剂量氯吡格雷组(300mg、600mg),后75mg/日,连服2周。两组其他治疗包括硝酸酯类药物、β受体阻滞剂、钙离子拮抗剂、ACEI、他汀类降脂药物,以及降糖药物等常规治疗。两组患者在易患因素、基础疾病、临床治疗方面差异无统计学意义,具有可比性。患者分别于给予氯吡格雷负荷量前、给予后6小时、24小时,48小时以及1周采血测定各项检测指标。并观察两组有无出血倾向、血细胞下降等不良反应。

检测指标:mPAR测定:取3.6ml注入含有0.109mmol/L的枸椽酸钠0.4ml的塑料试管中,离心,取上层液制得贫血小板血浆(PPP),以ADP为致聚剂,采用血液聚集仪,测定血小板最大聚集,用百分比(%)表示。

hs-CRP测定:采肘前静脉血,用真空采血针穿刺静脉,促凝剂加分离胶管取血2ml;采用超敏乳胶增强散射比浊法,经全自动生化分析仪测定。

不良反应:所有入选患者均完成临床试验,无严重出血及血小板、粒细胞下降发生。氯吡格雷600mg组有2例患者出现静脉穿刺部位瘀血,自行吸收,无需停药。

统计学分析:采用SPSS16.0统计软件包进行统计学处理。计量资料用(X±S)表示,组内比较采用t检验;组间比较采用方差分析。P<0.05为差异有统计学意义。

结 果

两组患者在基线资料差异无统计学意义,见表1。

表1 患者基本临床资料比较

注:两两比较,P均>0.05。

不同负荷剂量氯吡格雷患者血小板最大聚集率(mPAR)结果各组服药后后6小时、24小时,48小时以及1周mPAR均较服药前显著降低(P<0.01),差异具有统计学意义。在24小时后可维持较低的抑制水平。600mg组在服药后6小时MPAR较300mg组降低明显(P<0.01),但24小时后对血小板聚集的抑制与300mg组无明显差异,见表2。

治疗前两组患者血清hs-CRP浓度无差异(P>0.05)。氯吡格雷治疗24小时后血清CRP浓度均显著下降(P<0.01),600mg组在服药后24小时,48小时hs-CRP较300mg组降低明显(P<0.01);服药后1周则差异不显著(P>0.05),见表2。

讨 论

众多研究证实,急性冠脉综合征患者斑块的破裂及不稳定性与炎症反应直接相关[2]。实验研究发现[4],在内皮血管壁存在CRP,与人类中性粒细胞紧密结合,诱导补体活化;CRP与一些细胞黏附分子有关,这些黏附分子在白细胞通过内皮壁时黏附和移行中起重要作用,此过程是粥样硬化形成开始重要的一步。

氯吡格雷是噻吩吡啶类药物,为血小板二磷酸腺苷(ADP)受体拮抗剂,有较强抑制血小板激活作用。氯吡格雷的活性在一定范围内呈剂量依赖性。近年来,国外有学者报道,采用高负荷剂量氯吡格雷用于PCI术前抗血小板治疗可更快抑制血小板[5~7],并显现出较好的疗效和安全性。

本观察发现,ACS患者血清CRP水平显著高于正常范围,提示CRP可作为AS斑块不稳定的标志。氯吡格雷临床疗效显著,显著降低ACS患者mPAR及CRP水平,提示氯吡格雷除抑制血小板聚集,还可通过抑制CRP等炎症介质的生成和表达而起到抗炎和稳定斑块的作用。阿司匹林是不影响TXA2途径以外的血小板活化途径,低分子肝素可阻断凝血酶诱导的血小板聚集反应,但对ADP诱导血小板活化影响不显著。这可能是氯吡格雷组CRP水平下降显著优于常规治疗组的原因。

参考文献

1 ROSS R.Atherosclerosisan inflammatory disease[J].N Engl J Med,1999,340:115-126.

2 Rus H,Niculescu FI.Inflammation,aspirin,and the risk of cardiovascular disease.N Engl J Med,1997,337:423.3 贾利敏,黄立新.C反应蛋白的临床应用及预测价值[J].实用心脑肺血管病杂志,2006,14(9):761-762.

4 Torzewski J,Torzewski M,Bowyer DE,et al.C-reactive protein frequently colocalizes with the terminal complement complex in the intima of early atherosclerotic lesions of human coronary arteries.Arterioscler Thromb Vasc Biol,1998,18:1386-1392.

5 Kastrati A,Mehilli J,Schuhlen H,et al.clinical trial of abciximab in elective percutaneous coronary intervention after pretreatment with clopidogrel[J].N Engl J Med,2004,350:232-238.

6 Pache J,Kastrati A,Mehilli J,et al.Clopidogrel therapy in patients undergoing coronary stenting:value of a high - loading-dose regimen[J].Catheter Cardiovasc Interv,2002,55:436-441.

7 CAPR IE Steering Committee.A randomized,blinded,trial of clop idogrel versus asp irin in patients at risk of ischemic events[J].Lancet,1996,348:1329-1339.

表2 不同负荷剂量氯吡格雷各时间点MPAR比较(%)

注:>/sup>表示与服药前比,P<0.01;@>/sup>表示与300mg组比,P<0.05。

篇2

目前,很多研究人员对影像资料分析方法的学习和理解存在一定困难,尤其初学者对繁杂的概念、复杂的计算公式、数据资料性质判断以及如何选择合适统计学方法等问题难以深刻理解。针对这些问题,王良等[1]建议采用以下模式:判断资料类型、根据研究目的选择分析方法、其他适宜方法。

1.1根据资料类型初步确定方法

临床研究中产生的各种不同原始资料,而不同数据资料类型采用的统计分析方法也不同。定量资料常用的方法有t检验、方差分析、非参数检验、线性相关与回归分析等。定性资料可用的方法有χ2检验、对数线性模型、logistic回归等,影像医师可根据不同需要选用不同统计方法。值得一提的是有些资料类型确定后,统计方法的选用对其有序性有相应要求;而多种方法联合应用或者使用部分少见的分析方法时还需要在选定统计方法后,利用统计软件(如SAS、SPSS)对应的不同命令进行初步分析试验。

1.2根据研究目的选择方法

1.2.1差异性研究

差异性分析是指评价比较组间均数、频数、比率等的差异。根据研究需要可选用的方法有χ2检验、t检验、方差分析、非参数检验等。临床上研究两组、多组样本比率或构成比之间的差别关系时最常用χ2检验,也是针对计数资料进行假设检验的一种常用的统计学方法,而对两组定量资料分析常用t检验和秩和检验,多组资料分析则常用方差分析;Fisher精确概率法主要适用于总体样本频数小于40或四格表中最小格子T值<1。虽然Fisher精确检验不属于χ2检验,但仍可以作为有效的补充,而也有人认为在统计软件普遍易得的当下,Fisher精确概率法也同样适用于大样本四格表的资料。如彭泽华等[6]在探讨冠状窦-左心房肌连接的双源CT冠状动脉成像(DSCTCA)形态特征时针对冠状窦-左心房肌连接的类型在两组类别变量采用联表的χ2检验,结果差异无统计学意义(χ2=0.115,P=0.944)。Teefey等[7]在研究超声表现及白细胞计数预测急性胆囊炎坏疽变化关系时使用Fisher精确分析。t检验适用于两组定量资料分析且资料满足方差齐性和正态性两个基本条件;同样t检验适用于完全随机设计的单因素两水平的资料,在选用t检验时应注意对资料进行相应的变量变换,若资料不能满足基本条件则选用适合分析偏态分布的非参数检验(如:秩和检验)进行分析。如Wang等[8]在研究不同侵袭性的前列腺癌组织和正常前列腺组织以及外周带前列腺癌Gleason评分与肿瘤信号对比时采用t检验。Kung等[9]在研究化脓性髋关节炎的临床和放射学预测指标时也使用t检验分析。秩和检验包括基本秩和检验(Wilcoxon等级检验、Mann-WhitneyU-检验)和高级秩和检验(Kruskal-Wallis、Friedmantests、Kolmogorov-Smirnov拟合检验)。当研究资料为两方差齐且呈正态分布的总体,而总体分布类型未知或者不满足参数检验的条件时,采用t检验对样本进行比较;但若无需比较总体参数只比较总置的分布是否相同且总体资料分布类型未知时需要采用非参数的Wilcoxon秩和检验进行比较。针对两组或多组样本的定性资料使用秩和检验比较时,需要混合两样本数据、编秩(从小到大)、计量T值、查表或计算求得P值。如Saindane等[10]在对“空蝶鞍”的临床意义判定因素研究中针对颅内压增高和偶然发现空蝶鞍患者两组资料对比时采用Wilcoxon秩和检验。Filippi等[11]在研究DTI测量儿童Ι型神经纤维瘤病胼胝体派生指标时运用Wilcoxon秩和检验。事实上在影像资料分析中经常见到多重组间比较的情况,方差分析(analysisofvariance,ANOVA)就是用来推断两个或者多个总体之间是否有差别的检验,又称F检验。多重组间比较不能单纯选用两样本均数比较的t检验,但是可以根据资料类型选用ANOVA检验。若来自两个随机样本资料呈正态分布且方差齐性同的定量资料,应采用两因素(处理、配伍)方差分析(two-wayANOVA)或配对t检验。通过F检验可以比较可能由某因素所至的变异或随机误差,同时可了解该因素对测定结果有无影响。当不满足方差分析和t检验条件时,可对数据进行变换或采用随机区组设计资料的FriedmanM检验。Obdeijn等[12]在研究乳腺术前MRI能减少术中切缘和乳腺保守术后再次手术,使用ANOVA分析两组资料,结果对照组(29.3%)相比术前MRI病例组(15.8%)有效减少切缘和再次手术(P<0.01)。

1.2.2相关性分析

相关性分析不等同因果性,也不是简单的个性化相比,其涵盖的范围和领域较为广泛。统计学意义中的相关性分析包含相关性系数的计算,其过程为:每个变量转化为标准单位后,乘积的平均数即为相关系数。相关性分析可以用直观地用散点图表示两个或者多个变量的离散,当其紧密地靠近于一条直线时,即变量间存在很强的相关性。相关分析常用的方法有Pearson相关性分析、Spearman等级相关分析和卡方检验。临床中对两个或者多个均为定量变量的资料,且变量均呈正态分布时可选用Pearson相关分析,但多数情况下Pearson相关分析适用于两组资料的相关性分析。判断两变量之间线性关系的密切程度主要用Pearson积差相关系数,其范围为-1~+1。若相关系数的绝对值越接近1,即两变量间相关性越密切;反之,相关系数的绝对值越接近0,其相关性越差。实际上在高质量期刊论文中使用Spearman等级相关分析的研究也很常见,其通过相关系数进行变量间线性关系分析来判定两个变量间相关性的密切程度。而密切程度的量化指标则通过计算样本相关系数r,根据实际计算r绝对值所属范围来推断两个来自总体变量的线性相关程度,从而推断总体的相关性。根据实际分析需要,将相关关系密切程度分为6等:当IrI=0时,说明两变量完全不相关:当0<IrI<0.3时,说明两变量不相关;当0.3<IrI<0.5时,说明两变量低度相关;当0.5<IrI<0.8时,说明两变量显著相关;当0.8<IrI<1说明两变量高度相关:当IrI=l时,说明两个变量完全相关。王效春等[13]在研究磁敏感加权成像与动态磁敏感加权对比增强MR灌注加权成像联合应用在脑星形细胞瘤分级中的价值一文应用Spearman等级相关分析,结果显示肿瘤内磁敏感信号与相对血容量最大值和病理分级呈正相关(IrI分别为0.72、0.89,P值均<0.01),相对血容量与病理分级呈显著正相关(r=0.78,P<0.01)。又如Lederlin等[14]在比较几何参数、相关功能与组织学特性在哮喘患者的支气管壁CT衰减性关系中同时使用Pearson相关分析和Spearman等级相关分析,其r=0.39~0.43,表明与对照组相比常规CT衰减参数在哮喘患者平常支气管的CT参数、气道壁衰减方面更好的区分哮喘患者,同时也更好地区分气道梗阻。值得提及的是对资料有序或无序无法作出初步判定,且明确资料类型为定性资料时还可以选择使用卡方检验和Spearman等级相关分析。

1.2.3影响性分析

由于事物之间的联系是多种多样的,而某一结局可能受到来自其他多个方面的影响,此时为分析某一结局发生的影响因素可采用的资料分析方法有线性回归(一元或多元)、logistic回归、Cox比例风险回归模型(生存分析)等。在影像资料分析中一元线性回归是将影像资料中一个最主要影响因素作为自变量来解释因变量的变化。多元回归定义为某一因变量的变化受多个重要因素的影响,而此时需要用两个或多个影响因素作为自变量来解释因变量的变化,且多个自变量与因变量之间是线性关系(多个因变量之间相互独立)。实际研究中多元线性回归模型在影像资料分析应用较为广泛。Langkammer等[15]在磁敏感系数绘图在多发性硬化中应用研究中使用多元线性分析,结果显示各种影响因素中年龄是预测磁化率影响最强的因素。Logistic回归是研究二分类和多分类观察结果与某些影响因素自己建关系的一种多变化分析方法,其经常需要分析疾病与各影像指标之间的定量关系,同时又需要排除一些混杂因素影响。Logistic回归在统计学上属于概率型非线性回归,其分析思路与线性回归大致相同,能有效解决过高或过低水平因素以及分析因素少而样本量大等问题。相比多元线性回归,Logistic回归在处理分类反应数据方面更为常用,且适用于结局为定性影像资料。如Lee等[16]研究高分辨率CT在发现小蜂窝样特发性间质肺炎纤维化的连续变化和预后应用中使用logistic回归分析,结果表明高分辨率CT在网状和磨玻璃状范围内评价普通肺炎与非特异性纤维化肺炎之间差别明显(P<0.01)。在临床实际工作中常常需要分析生存时间与影像资料之间的关系,Kaplan-Meier法就是常用的一种分析方法,其又称乘积极限法,对大小样本资料分析均适用。实践中习惯上以时间为横轴、生存率为纵轴回执的阶梯状图称为Kaplan-Meier生存曲线(survivalcurve),也称K-M曲线。Cox比例风险回归模型是另一种生存分析方法,包括参数与半参数模型两类,其主要是进行多因素生存分析的一种方法,同时可分析众多变量对生存时间和生存结局的影响。Saad等[17]在经颈静脉肝内门体静脉分流术在肝移植受者的技术分析和临床评估研究中比较成功施行肝移植与非移植病人开展门体分流术(transjugularintrahepaticportosystemicshunt,TIPS)后的临床疗效评估,使用了Kaplan-Meier法,结果显示6~12个月、12~24个月、24个月以上,移植成活率分别为43%、32%和22%。生存期大于1年的晚期肝脏疾病模型存活评分低于17分、等于17分或大于17分的存活率分别为54%和8%(P<0.05)。

2其他适用方法

2.1ROC曲线

ROC(receiveroperatingcharacteristic)曲线是欧美影像学期刊中应用较为常见的统计学方法,国内期刊应用相对较少。ROC曲线根据一系列不同的分界值以真阳性率(灵敏性)为纵坐标,假阳性率(特异性)为横坐标绘制的曲线。ROC曲线分析结合灵敏度(sensitivity)和特异度(specificity)广泛应用于医学诊断,也应用于影像诊断及人群筛查。ROC曲线根据曲线下面积(areaundertheROCcurve,AUC)的大小对诊断试验作定量分析。理论上,AUC值在0~1间。根据实际情况将诊断分为不符合诊断(AUC<0.5)、无诊断价值(AUC=0.5)、低准确性(0.5<AUC<0.7)、一定准确性(0.7<AUC<0.9)、较高准确性(0.9<AUC<1),AUC越接近于1,表明诊断准确性越高。Hyodo等[18]在研究乏血管少结节的慢性肝脏疾病患者发展成富血管性肝细胞癌风险因素一文中使用ROC曲线分析,结果显示后续发展成血管性结节平均增长率明显高于非血管过渡性结节。

2.2Kappa检验

Kappa检验主要用于评价不同资料间一致性程度,常用Kappa值评价一致程度。Kappa系数适用于两项和多项无序分类变量资料。在影像学试验中常需要判断多名医师测量同一研究对象或者同一医师多次测量同一对象的一致性,Kappa一致性检验便是最佳选择。Kappa检验还可通过计算Kappa值对两种非金标准的诊断方法进行诊断结果一致性分析。一般而言,评价Kappa一致性需要计算Kappa系数,但在研究考察新的诊断试验方法是否优于金标准,或者检验是否与金标准一致时,还需要计算特异度、灵敏度、阳性预测值和阴性预测值等指标。目前公认的Kappa系数分为六个区段即一致性极差(Kappa值<0),一致性微弱(Kappa值0~0.2),一致性弱(Kappa值0.21~0.40),中度一致Kappa值(0.41~0.60),高度一致(Kappa值0.61~0.80),一致性极强(Kappa值0.81~1.00)。

2.3Levene检验

篇3

作者:李宁宁 于保荣 周立波 刘甲野 徐爱强 单位:山东大学卫生管理与政策研究中心 章丘市疾病预防控制中心 山东省疾病预防控制中心

城镇职工医保患者县级医院就诊的住院床日数是市级医院的1.48倍,存在统计学差异(P<0.001);城镇居民医保患者中,县级医院和市级医院基本持平;新农合患者中,县级医院就诊的住院床日数是市级医院的1.14倍,但无统计学差异(表略)。轻度慢性乙肝患者轻度慢性乙肝患者中,城镇职工医保与城镇居民医保患者县级医院的住院床日数均高于市级医院,其中城镇职工医保患者中,县级医院是市级医院就诊患者的1.60倍,存在统计学差异(P<0.001);城镇居民医保患者中,县级医院是市级医院的2.87倍,由于样本病例数较少,不能进行统计学推断;而新农合患者中,市级医院是县级医院的1.17倍,无统计学差异(表略)。中度慢性乙肝患者中度慢性乙肝患者中,城镇职工医保和新农合患者县级医院就诊患者的住院床日数高于市级医院,其中,城镇职工医保患者县级医院的住院床日数是市级医院的1.88倍,存在统计学差异(P<0.001);新农合患者中,县级医院就诊者的住院床日数是市级医院的1.23倍,无统计学差异;而城镇居民医保患者中,市级医院住院床日数是县级医院的1.1倍,无统计学差异。

重度慢性乙肝患者重度慢性乙肝患者中,城镇职工医保、新农合患者在县级医院和市级医院就诊的住院床日数均无统计学差异。但城镇职工医保和城镇居民医保患者在县级医院就诊的住院床日数均高于市级医院,其中,城镇职工医保中,县级医院是市级医院的1.26倍;城镇居民医保中,县级医院是市级医院的1.55倍。而新农合参保者中,市级医院就诊患者的住院床日数是县级医院的1.16倍。未分型的慢性乙肝患者未分型的慢性乙肝患者中,城镇职工医保、新农合的患者中市级医院就诊的住院床日数均高于县级医院。其中,城镇职工医保参保者中,市级医院就诊患者的住院床日数是县级医院的1.30倍,存在统计学差异(P=0.011);新农合参保者中,市级医院就诊患者的住院床日数略高于县级医院,无统计学差异。不同医疗保障制度下慢性乙肝患者出院转归情况比较我国目前的住院病历中,患者的出院病情转归分为“治愈”、“好转”、“未愈”、“转院”、“死亡”及“其他”几类。为便于分析,我们将“治愈”和“好转”合并,计算了各型慢性乙肝患者的“治愈或好转率”,轻度慢性乙肝患者中,城镇职工医保参保者的治愈或好转率最高,其次是新农合参保者。新农合参保者中,中度和未分型慢性乙肝患者的治愈或好转率最高。因医保类型不明的患者病例数较少,予以剔除。结果显示:轻度、中度及未分型的乙肝患者出院转归情况差异显著。住院床日数的影响因素分析以经过对数转换呈正态分布的住院床日数为因变量,以医疗保障类型、患者性别、入院年龄、慢性乙肝分型、病情转归、医院级别及病史月数为自变量,采用逐步多元回归分析。变量赋值和多元分析结果如表10所示,发现患者的医疗保障类型、医院级别、慢性乙肝分型及疾病转变情况(即出院转归)对住院床日数的影响具有统计学意义。出院转归的影响因素分析对患者的出院转归进行多因素分析,以住院床日数、患者性别、医疗保障类型、医院级别、入院年龄及慢性乙肝分型为自变量。其中医疗保障类型、入院年龄和慢性乙肝分型均分为三组,采用二分类Lo-gistic逐步回归分析,设赋值为0的那组为哑变量,其它各组分别与它进行比较。模型分析结果发现住院床日数越长,出院转归越好;慢性乙肝分型对出院转归也有影响。而医院级别及医疗保障类型等并不影响患者的出院转归情况。

上海市针对自费和享有医疗保障患者的研究中,采取直接访谈法,并结合病案室提供的住院病历资料,分析不同医疗保障水平下患者住院天数情况,结果显示,慢性乙型肝炎患者社保组住院天数是自费组的1.4倍,并没有分析在不同级别医院就诊患者的住院床日数差异。[3]本文主要通过对同一级别医院就诊的不同医保患者住院床日数做出分析,发现:城镇职工医保参保者的各型慢性乙肝患者的平均住院床日数大约为城镇居民医保患者的1.6~2.3倍,为新农合患者的1.5~1.9倍。国内还有研究发现省级医院乙肝病人住院床日数显著大于地市级医院。[4]本研究对不同级别医院就诊住院床日数分析发现,所有乙肝患者中,城镇职工医保患者县级医院就诊的住院床日数是市级医院的1.48倍,存在统计学差异。慢性乙肝不同分型患者的住院床日数分析中,发现轻度和中度城镇职工医保患者单病例住院床日数差异显著,县级医院就诊患者的住院床日数高于市级医院。这可能是因为县级医院的治疗水平与市级医院之间有较大的差距;另外,不同级别医院报销政策的差异,也会影响患者就诊流向及患者的住院床日数。不同医疗保障制度下慢性乙肝患者出院转归的差异轻度、中度及未分型慢性乙肝患者出院转归情况差异显著。其中轻度慢性乙肝患者中,城镇职工医保患者的治愈或好转率最高(97.9%),其次是新农合患者;中度慢性乙肝患者中,新农合患者的治愈或好转率最高(98.3%),其次是城镇职工医保。纳入本研究的城镇职工医保及新农合患者参保者较多,可能是其治愈或好转率相对高的重要原因。而未分型慢性乙肝患者中,城镇居民医保患者的治愈或好转率最高(100%)。住院床日数及出院转归的影响因素北京某传染病医院对原发性肝癌、肝硬化、乙型病毒性肝炎及丙型病毒性肝炎4种疾病进行研究显示,医院级别及患病严重程度是住院天数的影响因素。[5]本研究结果发现,在不考虑患者收入影响的前提下,慢性乙肝患者的住院床日数受患者医疗保障类型、医院级别、慢性乙肝分型及出院转归影响,而出院转归亦受到住院床日数及慢性乙肝分型的影响。患者的出院转归与住院床日数是相互影响的关系。不同的医疗保障制度,其报销比例及待遇不同,对医生及患者的激励作用也不同,从而患者的住院床日数及出院病情转归可能会受到一定的影响。

篇4

医学统计学是医学科学的一个组成部分,是医学院校各专业的必修课。医学统计学作为

保证医药科研工作的重要手段已写入有关文件的要求中,作为高层次的医学专业人员,通过学

习本门课程,可以较好地把统计原理和方法的思维逻辑应用于科研和管理中,尤其在本学科

的研究设计和数据分析方面,更为明显。

通过本门课程的学习,要使学生学会人群健康研究的统计学方法,学会计量、计数资料的分析,

非参数统计方法和多元统计分析方法及医学研究设计。其目的使大家具备新的推理思维,结合专业问

题合理设计试验,科学获取资料,提高科研素质。

本课程教学的主要方法有理论讲授、课堂讨论、课堂演算等,使学生加深对理论的理解。

【主要内容及要求】

第一章绪言

1.掌握统计工作的步骤。

2.掌握统计资料的类型。

3.掌握总体与样本、概率、小概率事件,误差等基本概念。

4.熟悉统计学、医学统计学的定义、掌握统计学的研究对象。

5.了解学习本门课程应注意的问题。

第二章个体变异与变量分布

1.掌握均数、几何均数、中位数的计算和应用;掌握四分位数、标准差的应用;相对数常用指标、应用相对数的注意事项;正态分布的应用和医学参考值的估计。

2.熟悉利用统计图表描述定量资料的基本方法;制作统计图表的基本要求和规则;百分位数的计算方法;正态曲线的面积的分布规律。

3.了解定量资料频数分布表的编制方法和分布规律;常用疾病统计指标的计算;正态分布的概念及特征。

第三章抽样误差

1.掌握抽样误差的概念;标准误的意义及其应用;t分布特征及应用。

2.熟悉抽样误差影响因素;标准误的计算。

3.了解t分布特征

第四章可信区间

1.掌握可信区间的概念,总体均数95%和99%置信区间的计算及适用条件;掌握正态近似法计算总体率的95%和99%置信区间及适用条件;阐述标准差与均数标准误的区别。

2.熟悉可信区间的两个要素,查表法估计总体率的置信区间。

3.了解两均数之差的可信区间。

第五章假设检验

1.掌握假设检验的意义及步骤;第一类错误与第二类错误。

2.熟悉假设检验的基本思路;假设检验的条件;P值含义。

3.了解差异检验与优度检验;区间估计与假设检验之间的关系。

第六章定量资料的分析

1.掌握t检验的应用条件及类型,常用的t检验分析与计算过程;方差分析的基本思想;单因素方差分析的过程。

2.熟悉方差不齐时的t‘检验;多样本的两两比较方法。

3.了解两样本几何均数的比较;方差齐性检验;变量变换。

第七章定性资料的分析

1.掌握X2检验各种公式的适用条件和各种设计类型的X2检验的步骤及行×列表资料X2检验的注意事项。

2.熟悉样本率与总体率比较的u检验;多个率的多重比较;似然比检验。

3.了解两样本率比较的u检验;确切概率法。

第八章等级资料的分析

1.掌握非参数统计的概念;不同设计类型的秩和检验的实施方法及其应用条件。

2.熟悉不同设计类型的秩和检验方法。

3.了解不同设计类型的秩和检验和相应t检验的功效有何不同。

第九章两指标间的直线相关

1.掌握利用散点图确定两个定量变量之间有否线性关系;掌握Pearson积差相关、Spearman等级相关的应用条件并能计算相应的相关系数,同时进行假设检验;对分类计数频数表资料的两变量间的关联性作定量分析。

2.熟悉对不同类型的变量,用不同的统计方法去分析它们之间的关系。

3.了解利用散点图分析样本相关系数可能出现的各种假象,并作出合理解释。

第十章两指标间的直线回归

1.掌握回归的基本概念;回归分析的基本思想与方法;回归系数检验的意义与方法;相关与回归分析的区别与联系。

2.熟悉总体回归系数β的统计推断;残差与残差分析。

3.了解总体回归线的95%置信带与个体预测值Y的区间估计;过定点的直线回归。

第十一章多元回归分析

1.掌握多元线性回归、Logistic回归、Cox比例风险回归方程中的偏回归系数、标准化偏回归系数、确定系数、复相关系数、比数比(OR)的概念、应用、计算结果的解释。

2.熟悉回归分析的分类,残差的概念,最小二乘法求多元回归方程,回归方程的配合适度检验,逐步筛选法选择自变量,最大似然估计法求Logistic回归方程及Cox比例风险回归方程,似然比检验筛选自变量。

3.了解多元线性回归、Logistic回归模型。

第十二章研究设计(一)——总论

1.掌握医学研究设计的意义,研究设计的形式、研究设计的基本原则和基本要素。

2.熟悉样本含量的估计方法。

3.了解调查设计的步骤和样本含量的估计方法。

第十三章研究设计(二)——实验设计

1.掌握实验设计方法选择的依据。

2.熟悉常用实验设计方法的特点与设计方式,如完全随机设计、配对设计、配伍设计、交叉设计、拉丁方设计、析因设计、正交试验设计。

3.了解常用实验设计方法样本含量的估计。

第十四章研究设计(三)——临床新药设计

1.掌握临床试验的特点,新药临床试验的分期,新药临床试验的基本原则。

2.熟悉新药临床试验的统计分析方法。

3.了解临床诊断试验与评价的方法。

第十五章统计表和统计图

1.掌握统计表的基本结构和要求,统计图形的选择、制图通则。

篇5

很多科研人员(包括临床医生)在进行科研工作过程中,习惯用专业知识取代一切其他知识。其突出表现是:等科研工作已经完成,甚至论文已写完,因某些数据处理有问题被退稿时,才想起要找统计学工作者帮助处理论文中的实验数据;考虑问题稍周到一些的科研人员在科研工作完成之后,在撰写论文之前就想到要运用统计学知识来分析实验数据。这两种运用统计学的科研人员都是在把统计学当作分析数据的“计算工具”或当作发表学术论文的“敲门砖”,是对统计学重要性认识不足的突出表现。理由很简单,科研数据是否正确可靠、是否值得进行数据分析、结论是否可信等一系列重要问题都没有令人信服的证据来帮助说明,换句话说,若缺乏科研设计或科研设计不科学、不完善,即使花费10年时间和数亿人民币进行调查或实验获得了大量科研数据,与某人用计算机产生的毫无专业含义的任意多个随机数据没有什么区别,除了浪费了大量国家和人民的血汗钱,对科学技术进步、对人类的贡献不仅为零,甚至是负数!因此,在进行科研工作之前,制定科学完善的科研设计方案,特别是其中的实验设计方案或调查设计方案的质量好坏,是科研工作成败的关键所在!

科研设计包括专业设计和统计研究设计。专业设计主要包括基本常识和专业知识的正确、全面、巧妙地运用;而统计研究设计包括实验设计、临床试验设计和调查设计。值得注意的是:在很多科研人员所做的科研课题中,不仅严重忽视统计研究设计,就连专业设计也有严重错误,主要表现在犯了基本常识错误和违背专业知识错误。这类错误所发生的频率还相当高,是一种不能容忍的不正常现象!

在统计研究设计所包含的3种研究设计中,实验设计是最重要的,因为很多关键性的内容都包含在其中,其核心内容是“三要素”、“四原则”和“设计类型”。所谓“三要素”就是受试对象(或调查对象)、影响因素(包括试验因素和重要的非试验因素)和实验效应(通过具体的观测指标来体现);所谓“四原则”就是随机、对照、重复和均衡原则,它们在选取和分配受试对象、控制重要非试验因素对观测结果的干扰和影响、提高组间均衡性、提高结论的可靠性和说服力等方面将起到“保驾护航”的作用;所谓“设计类型”就是实验中因素及其水平如何合理搭配而形成的一种结构,它决定了能否多快好省且又经济可靠地实现研究目标。科研人员若对重要非试验因素考虑不周到、对照组选择不合理、设计类型选择不当或辨别不清,导致科研课题的科研设计千疮百孔、数据分析滥竽充数、结果解释稀里糊涂、结论陈述啼笑皆非。下面笔者就“实验设计”环节存在的问题辨析如下。

1 在分析定量资料前未明确交代所对应的实验设计类型

人们在处理定量资料前未明确交代定量资料所对应的实验设计,对数千篇稿件进行审阅后发现,大多数人都是盲目套用统计分析方法,其结论的正确性如何是可想而知的。这是一条出现非常频繁的错误,应当引起广大科研工作者的高度重视。

2 临床试验设计中一个极易被忽视的问题——按重要非试验因素进行分层随机化

例1:原文题目为《气管舒合剂治疗支气管哮喘的临床观察》。原作者写到:“全部病例均来源于本院呼吸专科门诊和普通门诊,随机分为治疗组40例和对照组30例。其中治疗组男21例,女19例;年龄21~55岁,平均(36.28±9.36)岁;病程2~23年,平均(10.31±17.48)年;病情轻度者16例,中度24例。对照组30例,男16例,女14例;年龄20~53岁,平均(35.78±9.53)岁;病程3~24年,平均(11.05±6.47)年;病情轻度者13例,中度者17例。两组间情况差异无显著性,具有可比性。”请问这样随机化,其组间具有可比性吗?

对差错的辨析与释疑:显然,研究者在试验设计时未对重要非试验因素采用分层随机保证各组之间的可比性。这条错误的严重程度为不可逆,出现不可逆错误意味着原作者的试验设计具有无法改正的错误,必须重做实验!究其原因,主要是原作者未理解统计学上随机的概念。统计学上随机化的目的是尽可能去掉人为因素对观测结果的干扰和影响,让重要的非试验因素在组间达到平衡。稍微留意一下原作者随机化分组,明显带有人为的痕迹,治疗组40人比对照组30人多出10人;治疗组病程的标准差17.48是对照组病程的标准差6.47的近3倍。笔者很疑惑怎样的随机化才能达到如此的不平衡?事实上随机化有4种:子总体内随机、完全随机、分层随机和按不平衡指数最小原则所进行的随机,原文条件下应当选用分层随机,即以两个重要的非试验因素(性别和病情)水平组合形成4个小组(男轻,女轻,男中,女中),然后把每个小组内的患者再随机均分到治疗组和对照组中去,这样分层随机的最终结果一定是治疗组和对照组各35人,且使2组间非试验因素的影响达到尽可能的平衡,从而可大大提高组间的可比性。在本例中,若“病程”对观测结果有重要影响,在进行分层随机化时,在按“性别”和“病情”分组的基础上,还应再按“病程”(设分为短、中、长)分组,即共形成12个小组,将每个小组中的患者随机均分入治疗组与对照组中去,这是使“性别、病情、病程”3个重要非试验因素对观测结果的影响在治疗组与对照组之间达到平衡的重要举措,也是所有临床试验研究成败与否的最关键环节!

3 实验设计类型判断错误

例2:某作者欲观察甘草酸、泼尼松对慢性马兜铃酸肾病(AAN)肾损害的干预作用,于是,进行了实验,数据见表1。原作者经过用甘草酸和泼尼松分别与同期正常对照组和模型组比较,一个P<0.05,另一个P<0.01,于是得到甘草酸、泼尼松对慢性AAN肾损害具有一定程度的保护作用,且泼尼松的效果更佳。请问原作者的结论可信吗?表1 各组大鼠血BUN及SCr变化比较(略)注:与正常对照组同期比较,*P<0.05,**P<0.01;与模型组同期比较,P<0.05,P<0.01

对差错的辨析与释疑:本例错误极为典型,通常科研工作者欲观察某种药物是否有效,习惯上会建立正常对照组、模型组(即该药物拟治疗的病态组)和在模型组基础上的用药组(如本例中甘草酸组和泼尼松组)。这样的设计本身并没有错,但这仅仅是专业上的“实验安排(可称为多因素非平衡组合实验[1])”,而并非是统计学中所说的某种标准实验设计类型。写在“组别”之下的4个组,并非是一个因素的4个水平,而是2个因素水平的部分组合。这2个因素分别是“是否建模(即正常与模型2个水平)”和“用药种类[即不用药(相当于安慰剂)、用甘草酸和用泼尼松3个水平]”。2个因素共有6种水平组合,即“组别”之下缺少了“正常基础上用甘草酸”和“正常基础上用泼尼松”。这样设计的实验才可能反映出“是否建模”与“用药种类”2个因素之间是否存在交互作用。

在本课题研究中,由于未在实验前作出正确的实验设计,处理数据时错误就悄然产生了。具体到本例,从原作者在表1的注解中可以看出,通过单因素方差分析分别比较同期(即相同观测时间点)的甘草酸组和泼尼松组与正常对照组和模型组之间的差别是否有统计学意义。这样的做法有3个严重错误:第一,严格地说,在模型组基础上的用药组是不适合直接与正常对照组相比较的,因为这样的比较解释不清到底是药物的作用还是由于模型未建成功而造成的假象;第二,将各个时间点割裂开分别比较破坏了原先的整体设计,数据利用率降低,误差估计不准确,导致结论的可信度降低。将一个重复测量实验的各个时间点割裂开来考察,就等于在各个片段上估计实验误差、作出统计推断,好像盲人摸象一样,摸出来的结果差别何其之大;第三,要想说明两种药物哪个效果更佳,在得出差别具有统计学意义的基础上,衡量的标准是应看组间平均值的差量的大小而不应看P值是否足够地小,不能说P<0.01时就比P<0.05时更有效,这种忽视实验误差、忽视绝对数量和脱离专业知识的想法和做法都是不妥当的。

如何正确处理表1中的实验资料呢?关键要正确判定该定量资料所对应的是什么实验设计类型。由前面的分析可知,表1定量资料对应的是“多因素非平衡组合实验”,而不是某种标准的多因素实验设计类型。明智的做法是对“组别”进行合理拆分,即根据专业知识和统计学知识,对“组别”之下的所有组重新进行组合,应使每种组合对应着一个标准的实验设计类型。正确地拆分结果分别见表2和表3。表2 正常对照组与模型组大鼠血BUN及SCr变化的测定结果(略)表3 模型组和2个用药组大鼠血BUN及SCr变化的测定结果(略)

事实上,由科研习惯形成的这一套实验方案笔者形象地称之为多因素非平衡的组合实验,或者说,它是实验设计的表现型。通常可以进行统计分析的都必须是标准型(即统计学上所说的某种实验设计类型),因此需要能看出代表表现型本质的原型(本例中组别之下应该有6个组,这6个组构成一个2×3析因设计结构,但原作者少设计了2个组)。通常需要将表现型或/和原型拆分成标准型后再选择合适的统计分析方法进行数据分析。本例根据原作者的意图,可以将表1拆分成2个标准型,形成2个具有一个重复测量的两因素设计定量资料,见表2和表3。相应的统计分析方法就是具有一个重复测量的两因素设计定量资料的方差分析。此处请读者注意:第一,具有一个重复测量的两因素设计定量资料的方差分析和一般的方差分析虽然都叫方差分析,但它们的计算公式却有本质区别,绝不可混用;第二,重复测量因素(本例中为时间)不要与实验分组因素(表2中叫“是否建模”;表3中叫“药物种类”)同时列入左边,它们是本质不同的两种因素,一般应该把“重复测量因素”放到表头横线下方。

通过本例可以看出,在实验前明确实验设计是多么重要的一件事情。试想,若让本例原作者写明他的实验设计类型,他必然就会对基本的实验设计类型作一番调查和学习,自然就能发现他所“设计”的实验并不是统计学上相应的实验设计。那么通过咨询相关人士必能做出比较正确的实验设计,不仅可以提高科研设计水平,而且可以大大提高科研课题和论文质量。

例3:原文题目为《土荆芥-水团花对胃溃疡大鼠黏膜保护作用的研究》。原作者使用单因素多水平设计定量资料方差分析处理表4中的数据。请问原作者这样做对吗?表4 各组黏膜肌层宽度、再生黏膜厚度变化(略)注:与正常组比较,aP<0.05;与NS组比较,bP<0.05;与CP 10 mg·kg-1 组比较,cP<0.05

对差错的辨析与释疑:本例涉及到统计学三型理论[1]中的一些概念,简单地说就是可以直接进行统计分析的来自标准设计的数据表叫标准型,反映问题本质但并非是标准型的数据表叫原型,而掩盖了原型信息的数据表叫表现型。“组别”之下的6个组,似乎是某个因素的6个水平,其实不然!这6个组涉及到多个试验因素,应对“组别”拆分重新组合后,再分别判定各种组合所对应的实验设计类型,并选用相应的统计分析方法。组合1:空白对照组(正常)、阴性对照组(NS),这是单因素两水平设计(简称为成组设计)。由于正常组无实验数据,故该组合无法进行统计分析;组合2:NS组、RA组、CP(20/mg·kg-1)组,这是单因素3水平设计,因素的名称叫“药物种类”;组合3:NS组、CP(10/mg·kg-1)组、CP(15/mg·kg-1)组、CP(20/mg·kg-1)组,这是单因素4水平设计,因素名称叫CP的剂量(其中,NS组可视为CP的剂量为0)。

对于组合2和组合3,若定量资料满足参数检验的前提条件,可选用相应设计定量资料的方差分析,否则,需要改用相应设计定量资料的秩和检验。

4 人为改变设计类型且数据利用不全

例4:某作者使用表5中的数据进行分析,欲比较治疗组和对照组在治疗后的各个时间点的疗效情况,使用的分析方法为一般卡方检验,请问原作者这样做对吗?

对差错的辨析与释疑:从给出的统计表可以看出,该作者有意或者无意之间收集了一类相当复杂的实验设计类型下的定性资料,结果变量为多值有序变量的具有一个重复测量的两因素设计定性资料,处理这个设计下收集的定性资料要使用相应设计定性资料的统计模型分析法。由于上述方法过于复杂,因此,通常在实际运用中,实际工作者将重复测量因素武断地视为实验分组因素,从而使该资料变为结果变量为多值有序变量的三维列联表资料。在已经出错的前提下,原本应当使用CMH校正的秩和检验或者有序变量的多重logistic回归分析处理资料。然而,该作者显然在此基础上进一步合并了数据,将结果变量变成二值变量(有效、无效),也就是说,原作者实际使用的仅仅是最后一列数据(即总有效率),并且最为严重的错误是将三维列联表资料强行降维成二维列联表资料,使用一般χ2检验进行分析。经过一系列的简化与错误合并,最后结论的可信度还剩下多少呢?表5 原作者对2组疗效比较的试验设计及数据表达(略)注:与对照组同期比较,*P<0.05

由于篇幅所限,这类错误笔者只给出1例,实际上此类例子在很多杂志中普遍存在。这说明在进行实验设计时,很多研究人员并未做到心中有数;分析数据时,按自己熟悉的简单统计分析方法所能解决的数据结构强硬地改造数据,严格地说,在用表格表达实验资料的那一刹那就已人为改变了资料所对应的实验设计类型,这种做法的科学性和得出结论的正确性都将受到质疑[2]。

5 正交设计及数据处理方面的错误

人们在进行正交设计和对正交设计定量资料进行统计分析时,常存在下列3个误区:很多人过分强调用正交设计可以大大减少实验次数,因此,无论各实验条件(正交表中的每一行)下的实验结果波动有多大,都不做重复实验,这是第1个误区;将正交表各列上都排满试验因素,用对实验结果影响最小的试验因素所对应的标准误作为分析其他因素是否具有统计学意义的误差项,导致误差项的自由度较小,结论的可信度较低,这是第2个误区;在对正交设计定量资料进行方差分析后,即使存在多个无统计学意义的因素,仍对少数几个有统计学意义的因素进行解释,未将无统计学意义的因素合并到误差项中去重新估计实验误差,以获得具有较大自由度的误差项,这是第3个误区。

参考文献