一、IRT:理论与应用(论文文献综述)
岳通[1](2021)在《估计潜变量分布IRT模型的应用 ——以蒙特利尔认知评估量表为例》文中进行了进一步梳理项目反应理论(Item response theory,IRT)是现代心理计量学的柱石。在IRT的应用中,往往先验性假设被试的潜在特质分布为正态分布(表示为,Gaussian IRT)。但是,许多应用情景下,正态分布假设并不成立,不合理的潜变量分布假设会严重影响被试潜在特质水平估计结果,也会导致项目参数估计不准确等严重错误。因此,研究者提出多种估计潜变量分布的IRT模型。以往研究一般使用潜变量正态分布假设的IRT估计蒙特利尔认知评估量表(Montreal Cognitive Assessment,MoCA)的项目参数及被试参数。本研究重点探讨估计潜变量分布的IRT模型对MoCA数据的分析情况。研究一的主要目的是验证mirt软件包中估计潜变量分布IRT函数的可用性,以及探究正态分布假设的IRT模型和估计潜变量分布的IRT模型对正态或非正态潜在特质生成作答数据的拟合情况。结果表明:(1)参数返真性结果较好;(2)对正态分布潜在特质生成作答数据拟合最好的是Gaussian模型,对非正态分布潜在特质生成作答数据拟合最好的模型是DC-IRT(k=4)。研究二的主要目的在于探讨估计潜变量分布IRT模型在MoCA数据应用中的模型比较及项目参数估计问题。结果显示:(1)根据估计潜变量IRT模型间的相对拟合优度值,发现估计潜变量分布的IRT模型整体拟合优度比Gaussian模型好,拟合最好的模型为DC-IRT(k=8)。(2)根据DC-IRT(k=8)模型估计获得的项目参数值结果,发现绝大多数量表项目具有良好的难度与区分度参数。研究三的主要目的是探讨估计潜变量分布IRT模型在MoCA数据分析中的被试能力估计问题。结果发现:(1)相对拟合最优的DC-IRT(k=8)模型的被试能力估计值同其他DC-IRT模型估计结果存在差异。(2)DC-IRT(k=8)模型的被试能力估计值同Gaussian模型潜在特质估计值结果存在差异。综合而言,推荐使用DC-IRT(k=8)模型估计MoCA数据的项目参数及被试能力参数。
朱红月[2](2021)在《分位数多水平项目反应理论及异常反应行为研究》文中研究表明在教育和心理测量背景下,许多问题都围绕着人的潜在特质进行分析。项目反应理论(Item Response Theory,IRT)在测量题目的属性和人的潜在特质方面具有很多优势,因此有着广泛的应用。在IRT中,潜在特质通常指的是人的能力。本文主要关注两个问题,第一个问题是探究学生的特征(students’characteristics),例如性别、智力、家庭背景等因素与学生学习成绩(能力)之间的相关性。掌握这些因素对学生能力的影响效应,有助于为教育政策的制定和实施提供理论支持,以提高学生的学业成就。另一个问题是,要对能力进行客观、准确的评估,排除影响测评结果的不良因素。在这里,我们主要关心被试在测试过程中的异常反应行为,包括在考试刚开始由于紧张造成的热身行为,或者由于时间紧迫造成的加速行为等。异常反应行为下的作答结果会影响测评的有效性,进而影响对被试能力的分析和评估,因此,将异常反应行为准确地检测出来是具有重要意义的。本文基于IRT,对上述两个问题展开了研究,具体分为以下两个部分:第一部分,许多研究在IRT的基础上,提出了多水平项目反应理论(Multilevel IRT,MLIRT)模型,分析了感兴趣的因素(解释变量)对学生平均能力的影响。然而,在能力分布是非对称的情况下,对平均能力的分析并不具有代表性。近些年,许多研究也越来越关注能力的整体分布,但是目前尚未有文献在IRT框架下研究解释变量对能力整体分布的效应。本文首次在IRT下引入了分位数回归(QR)分析,对能力与解释变量之间建立了QR模型,称之为多水平项目反应理论(Quantile MLIRT,Q-MLIRT)。Q-MLIRT同时具有IRT模型和QR模型的优良性质,既考虑了对能力测量的误差,也能够对解释变量与能力之间的关系进行更加完整的分析,并且当能力是非对称分布时,对能力中心位置的度量也更加准确。此外,QR不依赖方差齐性的假设,具有更强的稳健性。本文在贝叶斯框架下,提出了Gibbs抽样算法,对Q-MLIRT模型中的参数进行估计,考虑了所有参数在估计过程中的不确定性。接着,通过模拟研究表明,在不同的条件下,Gibbs抽样算法可以将Q-MLIRT模型的参数准确地估计出来。最后,使用Q-MLIRT模型分析了2018年国际学生评估(Program for International Student Assessment,PISA)中学生的数学成绩与学生个人以及家庭背景因素之间的关系,验证了该模型的应用价值。第二部分,许多研究旨在检测异常反应行为,通常将具有异常反应行为的被试作答反应删除,进而提高对项目参数的校准以及被试能力估计的准确性。近年来,变点分析(Change-Point Analysis,CPA)检测方法得到了研究者的关注,CPA不仅可以检测出异常反应行为,也能提供变点(异常反应行为发生的位置)的信息,因此可以有针对性的对数据进行筛选。本文在此基础上,提出了一种贝叶斯变点分析检测方法。与目前的CPA方法不同,该方法使用了被试在每道题目上的反应时间(Response Times,RTs)信息,可以提高对异常反应的检测效率。同时,该方法将变点的数量和位置作为随机变量,结合先验信息和数据信息,通过后验分布对二者进行推断。进而,根据变点的位置,可以估计出被试在测试各个阶段的作答速度。该方法的优势如下:(1)允许每个被试存在多种异常反应行为或多个变点的情况;(2)对变点位置的依赖性较小,不依赖对参数的极大似然估计(MLE);(3)结合变点位置与作答速度的信息,能够更加准确的对异常反应行为做出判断。仿真结果表明,该方法不仅可以有效地检测出异常反应行为,也可以准确地估计出变点的数量和位置,同时虚警率(将没有变点检测为有变点的被试比例)也可以控制在一个合理范围内。最后,本文利用贝叶斯CPA方法分析了一批计算机自适应测试(Computerized Adaptive Testing,CAT)的数据,对被试的异常反应行为进行了检测,验证了所提方法的实用性。
吴傅蕾,黄青梅,杨瑒,蔡婷婷,袁长蓉[3](2021)在《项目反应理论在患者报告结局测量工具研究中的应用及展望》文中研究指明项目反应理论(IRT)作为现代测量学理论,在患者报告结局(PROs)研究中的应用日渐广泛。护理人员有必要对其深入了解,以促进PROs的相关研究。基于此,本文介绍IRT的基本概念和特点,总结其在PROs测量工具研究中的应用,并提出IRT应用于PROs测量工具研究的展望,以期为后续研究和应用提供理论依据和实践参考。
韩奕[4](2020)在《项目反应理论框架下的运动神经元病患者报告结局评价量表研究》文中认为目的探讨ALS功能评价量表修订版(ALSFRS-R)量表在中国人群的适应性;基于项目反应理论验证运动神经元病患者报告结局评价量表(MND-PRO)在中国人群应用的可行性及疾病评价能力;基于MND-PRO量表探索运动神经元病(MND)患者的神经丝蛋白轻链(NfL)水平、中医证候特征与疾病演变的关系。方法采集61例国内本土 MND患者的ALSFRS-R量表,使用倾向性评分配对法与国际ALS临床试验开放数据库(PRO-ACT)上的患者进行1:1匹配,运用项目反应理论(IRT)对两组MND患者的ALSFRS-R量表的各个条目及其选项进行分析,对比国内患者在ALSFRS-R各条目评分与欧美人群的差异,验证ALSFRS-R量表是否适用于中国文化、语言和生活背景下的MND患者。运用项目反应理论对团队前期开发的MND-PRO量表的条目及其选项进行量化分析,进一步采集79例国内MND患者的ALSFRS-R量表数据对MND-PRO量表的有效性及疾病严重程度评价能力进行验证。基于项目功能差异分析,运用32例MND患者的神经纤维丝蛋白轻链(NfL)及中医四诊信息,研究不同NfL水平、不同中医证候特征的MND患者在MND-PRO量表上的表现,并探索不同分层方式的疾病演变模式及临床应用的意义。结果根据患者年龄、性别、起病部位,运用倾向性评分成功匹配患者共116例,每组各58例,通过项目反应理论发现中国人群的ALSFRS-R量表12个条目的项目区分度为(12.71、1.27、2.63、0.86、1.42、3.68、6.84、1.65、0.96、2.64、0.81、3.56),项目难度为(6.50、1.30、5.24、0.72、0.39、3.37、2.20、0.72、0.47、1.66、1.27、3.03);PRO-ACT 平台上欧美人群的 ALSFRS-R 量表 12 个条目的项目区分度为(2、2.29、9.21、0.41、0.32、2.22、7、1.47、0.57、1.65、3.03、1.01),项目难度为(3.13、3.05、9.60、2.36、0.85、1.34、11.60、0.29、1.12、2.51、1.68、1.88),研究发现中国、欧美人群在延髓维度和呼吸维度上的差异性较大,项目功能差异分析发现中国与外国人群在“条目4书写”、“条目6洗漱”和“条目12呼吸功能不全”上的M-H检验P值分别为(0.001、0.003、0.002)存在差异,表明该量表在中国与外国人群中具有不同的表现,应根据文化生活背景做出调试。MND-PRO量表的量化分析共纳入79名国内MND患者,通过项目反应理论发现MND-PRO 量表的 20 个条目的项目区分度为(3.61、3.71、1.33、3.75、-0.06、1.17、3.06、0.45、0.55、0.4、1.21、0.97、0.94、0.22、3、0.75、1.88、2.95、0.42、0.99),项目难度为(0.24、1.05、-3.04、-1.24、0.64、-0.11、1.27、-1.58、-1.23、-1.48、-2.10、-1.09、-1.69、-1.87、4.80、-2.59、-0.69、-2.46、-0.87、-2.66),对 79 例患者的量表效标关联效度分析显示,MND-PRO量表与ALSFRS-R的Pearson相关性为-0.69,说明MND-PRO量表可行性良好,具有预测及评价疾病的能力。对32例采集血清患者按照NfL中位数(58.32pg/ml)进行分组,其MND-PRO量表的项目功能差异表示在“条目8言语”、“条目9饮水呛咳”、“条目10吞咽困难”、“条目 16 治疗渴望”的 M-H 检验 P 值分别为(0.00001、0.00006、0.00002、0.00003)。使用项目功能差异分析对不同中医证候特征分组的患者进行分析,其中虚实辨证患者在疾病早期并无差异,但随着疾病严重程度的加重,实证患者的疾病进展速度较虚证加快;阴虚生风的患者在疾病早期功能变化不明显,但随着疾病严重程度的进展阴虚生风者的疾病进展较块并预后较差。结论本研究发现ALSFRS-R量表在中国人群的应用中,在运动维度上观察到与欧美人群存在功能表现差异,在延髓维度与呼吸维度上中国人群存在自己的疾病特征及对疾病的描述习惯。故而,ALSFRS-R并不能很好地适用于中国人群,需要对该量表进行进一步调试及科学性考评,或者研制一种新的适用于中国MND患者的评价量表。本研究进一步在国内MND患者中探索了本团队研发的MND-PRO的适用性。基于项目反应理论的量化分析证明,MND-PRO量表模型设置合理,除“条目5肌肉跳动”外,其余条目可以在不同疾病严重程度提供适当的信息,并且在不同年龄、性别、起病部分分组中也显示出良好的一致性;且该量表与ALSFRS-R量表的强相关性,再次佐证MND-PRO的可信度。这些结果共同表明,MND-PRO可作为MND临床实践和科学研究中的评价工具,尤其适用于中国人群。本研究还证实,不同NfL表达的患者在MND-PRO量表上具有不同的演变模式,且不仅与神经功能缺损相关,也与心理精神状态相关,也侧面证明该量表可反映疾病预后。不同中医证候特征的MND患者存在疾病演变的差异,虚实辨证及内风中的阴阳辨证具有不同的疾病表现、演变模式、预后,这为今后MND中医临床研究中患者人群的选择及干预方案的设计提供了基础,也为今后对不同证候特征病人优化临床干预方案、提高辨证论治效果提供重要依据。
魏思琪[5](2020)在《宫颈癌患者治疗期症状评估量表的开发及初步应用》文中认为研究目的1.开发适用于宫颈癌患者的症状评估量表。2.基于经典测量理论和项目反应理论评估“宫颈癌患者治疗期症状评估量表”的信效度。3.调查宫颈癌患者放疗期间的症状,并提取症状群,分析患者的一般资料与症状群之间的关系。研究方法1.采用研究小组讨论、宫颈癌患者访谈及参考现有量表和已发表文献,建立“宫颈癌患者治疗期症状评估量表”的条目池,然后进行两轮的专家咨询进行条目的筛选,通过对50名宫颈癌患者的预调查,进一步调整量表的语言表述。2.使用一般资料调查问卷、疾病相关资料调查问卷、初始版“宫颈癌患者治疗期症状评估量表”和中文版记忆症状评估量表调查274名宫颈癌患者,采用内部一致性评估量表的信度,采用内容效度指数、探索性因子分析和相关分析评估“宫颈癌患者治疗期症状评估量表”的效度。然后,采用因子分析评估“宫颈癌患者治疗期症状评估量表”各个领域的单维性;使用Stata 15.0分析“宫颈癌患者治疗期症状评估量表”前4个领域中各条目的难度和区分度,并绘制各条目的项目特征曲线、项目信息曲线和整个领域的测验信息曲线。3.使用一般资料调查问卷、疾病相关资料调查问卷和“宫颈癌患者治疗期症状评估量表”调查184名盆腔外照射第三周的宫颈癌患者,采用探索性因子分析从发生频率>20%的症状中提取症状群,采用Cronbach’sα系数检验各症状群的稳定性,采用Pearson相关分析、独立样本t检验和单因素ANOVA检验比较4个症状群在不同组别患者中的差别,探究患者的一般人口学资料和疾病相关资料与放疗期间症状群的关系。研究结果1.量表开发。经过研究小组讨论、对宫颈癌患者进行访谈以及参考现有相关量表及已发表文献后,确定该量表应包括泌尿生殖系统、消化系统、心理精神症状、治疗相关症状等4个方面。编写量表的条目池共包括38个症状条目。每个条目均采取0-10分多级评分方式,0分表示该症状不存在,10分表示能想象的最严重程度。经过两轮专家咨询后,删除I-CVI<0.78的18个症状,将阴道异常出血和阴道异常分泌物合并为一个症状条目。最终形成“宫颈癌患者治疗期症状评估量表”初始版,共包含19个生理、心理症状。2.量表测量学特性的评估结果。“宫颈癌患者治疗期症状评估量表”共提取5个公因子,分别命名为心理相关症状、泌尿生殖系统症状、消化道系统症状、化疗相关症状和疼痛-疲乏5个领域,累积方差贡献率为77.23%。量表的I-CVI的范围是0.86-1.00,S-CVI/Ave为0.94。“宫颈癌患者治疗期症状评估量表”与MSAS-Ch中相同的13个条目及两个量表总分的聚合效度的相关系数范围是0.01-0.99,其中两个量表的疼痛、恶心、呕吐、精神紧张、压抑、焦虑和脱发等症状具有较好的相关性,而腹胀和腹泻不相关,疲乏、食欲不好、体重下降三个症状方面相关性不好,手脚麻木或刺痛和两个量表的总分属于中等程度相关。宫颈癌患者治疗期症状评估量表的整体Cronbach’s系数为0.858,心理相关症状、泌尿生殖系统症状、和疼痛-疲乏三个领域的Cronbach’s系数分别为0.94、0.97和0.92,消化系统症状和化疗相关症状两个领域的Cronbach’s系数为0.68和0.67。应用项目反应理论评估量表质量。经主成分分析法运算后,4个领域的第一特征根与第二特征根的比值均大于3,满足单维性假设。心理相关症状、泌尿生殖系统症状、消化道系统症状和化疗相关症状四个领域中各条目的区分度分别为0.61-0.71、0.68-0.72、0.72-1.48和0.68-3.25。17个条目中除条目2、3、19外,其他条目的反应阈值(难度)均明显超过-33的理论范围。各条目的IIC中,只有条目2的信息量>3,其他条目的信息量均不超过0.5。3.量表初步应用。宫颈癌患者放疗期间发生频率最高的症状是腹泻(88%)、疲乏(82.1%)、大便带血(56.0%)、腹胀或身体肿胀(54.3%)、肛周疼痛或出血(53.3%)等。最严重的症状是疲乏(3.33±2.19)、腹泻(3.20±2.06)、肛周疼痛或出血(1.97±2.80)、腹胀或身体肿胀(1.96±2.22)、大便带血(1.80±1.95)和疼痛(1.80±2.48)。14个发生频率>20%的症状,共提取4个症状群,分别为心理相关症状群、泌尿生殖系统症状群、消化道-疼痛症状群以及消化道-疲乏症状群。4个症状群的累积贡献率为78.87%。各个症状群的Cronbach’sα分别为0.96,0.94,0.75和0.67。不同工作状态的患者在心理相关症状群的得分差异具有统计学意义(t=2.37,P<0.05),放疗前是否接受手术的患者在泌尿生殖系统症状群的得分差异有统计学意义(t=2.45,P<0.05)。结论1.初始版“宫颈癌患者治疗期症状评估量表”的条目包含宫颈癌患者治疗期间及治疗后常见的生理及心理症状症状,覆盖面较广。语言表述清晰易懂。2.“宫颈癌患者治疗期症状评估量表”具有较好的信度和效度,可用于评估宫颈癌患者治疗相关的症状。该量表心理相关症状领域、泌尿生殖系统症状领域、化疗相关症状领域和消化系统症状领域的条目区分度较好,但是难度过大。3.腹泻和疲乏是宫颈癌患者在放疗期间最常出现且最严重的症状。通过探索性因子分析,得到4个相对稳定的症状群,分别是心理相关症状群、泌尿生殖系统症状群、消化-疼痛症状群和消化-疲乏症状群。治疗前仍在工作的患者的心理相关症状群的得分低于不工作的患者,而放疗前接受手术的患者的泌尿生殖系统症状群得分更高。
胡晓娟[6](2020)在《基于贝叶斯广义分部评分模型以及OBID方法的普适性癌症PRO量表研制与评价》文中研究指明目的:基于PRO在测量疾病负担和评价临床疗效中的特点与作用,研制适用于我国地域文化特征的普适性癌症PRO量表,通过获取PRO数据评价癌症患者的生存质量、治疗效果以及药物的副作用;依据2006年FDA发表的指南方针计算最小临床意义变化值,解释PRO量表分值变化的临床问题;探索通过研制的普适性癌症PRO量表识别癌症患者的潜在亚组,确定各个维度在不同亚组之间的PRO风险临界值,为癌症患者的临床治疗和护理干预个性化奠定基础。方法:按照FDA发表的关于PRO量表的规范指南,研究人员综合文献检索查询到的国内外与癌症相关的问卷,咨询相关专家并结合癌症患者访谈记录相关的信息,形成适用于癌症患者的普适性PRO量表理论框架和条目池,并且再次经过专家评分和癌症患者的认知测试,形成初始量表;本次问卷调查在山西省7家不同级别医院和河南省肿瘤医院进行,先在较小范围之内适量地抽取一些代表性的样本进行初步调查分析,剔除调查结果中不满足标准的条目,合并一些类似的相关条目,再次使用修改后的量表进行较大规模的正式调查,量表数据回收后再次采用经典测验理论做条目的筛选,形成Cancer-PROM的初版本;然后采用频率理论和贝叶斯概念的广义分部评分模型(GPCM)分别在呼吸、消化、血液和内分泌疾病系统上对量表的初版本进行条目反应性的评价,删除反应差的相关条目,形成Cancer-PROM的终版本。从信度(克朗巴赫α系数、entire reliability)、效度(内容效度、结构效度、OBID、区分度)和可行性分析(接受率、完成率、问卷作答时间)来评价基于患者自我报告的普适性癌症PRO量表。计算普适性癌症PRO量表生理、心理和社会领域上的最小临床意义差异值(MCID),以此来预测癌症患者生存状态的改变;根据癌症患者存在的异质性特征,应用潜在剖面分析(LPA)探索癌症患者中潜在的亚群,通过癌症患者的一些基本情况和健康状况中的变量进一步验证亚群分组的合理性,并绘制各个维度在不同亚群的核密度曲线,通过曲线的交叉点确定相应的PRO风险临界值。结果:本量表形成了 4个(生理、心理、社会、治疗)领域和13个维度(共性症状、睡眠、饮食、疼痛、焦虑、绝望、社会影响、社会适应、治疗满意度、患者依从性、手术副作用、化疗副作用、放疗副作用)的概念框架,以及包含83个问题的初始条目池。经过专家评分和癌症患者认知测试,删除了 11个条目,并对条目进行语言性调试。初步调查和正式调查共发放了 2800份问卷(包括2200名癌症患者,600名非癌症患者)。最终,共收集到2490份问卷(包括1958名癌症患者,532名非癌症患者),其中癌症患者包括初步调查的591名患者和正式调查的1367名患者。两组的受访者基线数据经t检验和卡方检验表明具有可比性。初步调查采用经典测验理论进行条目筛选,建议删除17个条目.但考虑到条目的实际意义,暂时保留了 5个条目(PHD1、PHD4、PHD9、TRD8 和 TRD13),将 PHD7、PHD10 和 PHD12 合并为一个条目(命名为胃肠道异常),共形成了包含61个条目的量表;在此基础上进行正式调查,再次采用经典测验理论筛选条目,删除了 8个条目,形成了包含53个条目的Cancer-PROM初版本。根据呼吸、消化、血液和内分泌系统筛选癌症患者,其中呼吸系统有436例,消化系统有710例,血液系统有267例,内分泌系统有182例,采用在频率理论和贝叶斯概念下的广义分部评分模型(GPCM)分别对4个系统上的条目进行反应性的评价,删除4个反应差的条目,形成Cancer-PROM的终版本(4个领域,13个维度和49个条目)。继而对Cancer-PROM的终版本进行量表的评价,各个维度的克朗巴赫α系数和entire reliability系数均≥0.7;在量表研制的前期阶段,通过文献检索、专家咨询和患者认知测试保证了量表的内容效度,验证性因子分析的标准化因子载荷大部分大于0.4,通过OBID方法计算出来的因子载荷贝叶斯估计值均>0.4,说明研制的量表满足预期的研究目的和构想。量表的回收率为89.93%,有效率为88.87%,癌症患者平均作答时间为14.2分钟,说明该量表具有可行性。采用分步法(distribution-based method)方法确定生理、心理和社会领域的的最小临床意义差异值(MCID)分别为5.63、3.42、4.16,为评价癌症患者的健康状态提供了初始值。在Cancer-PROM的生理和心里领域上采用潜在剖面分析(LPA)对癌症患者存在的异质性特征进行分析,生理领域分成2个亚群组(高生理功能组和低生理功能组),共性症状、睡眠、饮食和疼痛在两个分组上的PRO风险临界值分别为71.74、71.28、66.29和65.16;心理领域分成2个亚群组(高心理素质组和低心理素质组),焦虑和绝望在两个分组上的PRO风险临界值分别为59.56和66.60。结论:普适性癌症PRO量表(Cancer-PROM)具有良好的可靠性、有效性和可行性,可以作为评价癌症患者生存质量的临床测量工具。确定的MCID和PRO风险临界值为评估癌症患者所处的健康状态和潜在风险提供了依据。
孔亚鑫[7](2020)在《基于EM算法的IRT模型参数估计及应用研究》文中指出项目反应理论(Item Response Theory,IRT)的发展为完善测评数据的分析提供了新的思路。IRT的显着特点是以概率模型的形式表达被试的作答反应结果是如何受被试潜在能力水平与项目参数共同影响的,当项目的难度与被试的潜在能力水平相匹配时,测验的效率将大幅提升。如何准确快速的估计IRT模型的参数是有效应用IRT的关键内容,尤其是在大数据的背景下,研究高效的参数估计算法以及明确有效的特征数据对提高参数估计的准确性具有非常重要的意义,在一定程度上推动着IRT的理论发展与实际应用。期望最大化算法(Expectation Maxization Algorithm,EM)作为一种迭代优化策略,由于其思想简单成为了近年来处理不完全数据问题的有效方法,基于EM算法可以利用被试的作答反应数据有效的解决IRT模型的参数估计问题。本文基于EM算法对IRT模型的参数估计问题进行了研究。主要研究内容如下:首先,在连续潜变量离散化的形式下,根据EM算法的原理推导了项目参数和潜在能力分布参数的估计过程,分析了影响参数估计准确性的因素并通过三个模拟实验确定了影响因素的最优参数设置,并将估计结果与模拟真值、基于Gauss-Hermite积分的MML/EM算法以及MCMC算法的估计结果进行了对比,说明了本文实现的EM算法参数估计的准确性。其次,针对EM算法在大数据量下需要较长的执行时间才能得出最终结果的问题,本文提出了一种基于并行思想的改进算法PE-PM算法,利用Python中的dask并行计算库通过自定义的方式实现了EM算法的E步内并行和M步内并行的运算,有效的提高了算法的执行速度,减少了内存的占用,为EM算法处理大规模测评数据的分析提供了条件。然后,在EM算法的基础上,针对不同特征数据对参数估计的影响,本文主要研究了两方面的内容,其一研究了区域数据与整体数据对参数估计的影响,通过模拟实验分析的方式得出了被试能力分布的均值和方差与项目参数中的难度和区分度参数估计结果之间的关系;其二研究了出现被试答对率与项目难度不一致现象的异常数据时对参数估计结果的影响,通过模拟实验分析的方式得出了异常数据对参数估计的影响关系,并通过异常数据检测统计量证明了在异常数据量较小的情况下项目反应模型参数估计的稳定性。最后,将基于EM算法的IRT模型应用于考试数据的分析中,收集和整理了某校数学科目测评的被试作答反应数据,对原始数据进行预处理后,通过本文研究的EM算法估计出了IRT模型中的项目参数以及被试能力水平参数,并分析了项目参数设置的合理性以及被试能力水平与难度参数的匹配性,为更好的测量被试的能力水平提出了合理化的建议。本文的创新之处在于:1、通过模拟实验的方式分析了实现EM算法参数估计过程中的影响因素,并给出了最优的参数设置。2、提出了一种基于并行思想的改进算法PE-PM算法,实现了EM算法的E步内并行和M步内并行的运算,有效的提高了算法的执行速度。3、基于EM算法研究了不同特征数据对IRT模型参数估计结果的影响,为获得精确的参数估计结果的数据处理过程提供了参考。
刘思杨[8](2020)在《结合反应时的多维项目反应模型的开发与验证》文中认为随着信息技术的飞速发展,计算机化测试在大型测验中越来越受欢迎。在测试过程中收集的所有辅助数据中,被试的作答反应时(RT)可能是最重要和最常用的信息源之一。在测验中利用反应时信息将有助于分离速度和能力(或特质)、更好地设计测验、辨别测验中的异常行为、提高被试与项目的参数估计精度、提高计算机自适应测验(CAT)项目选择的效率、以及比较个体的作答策略。因此,如何利用反应时数据信息为被试提供更加精确的测量结果成为了研究者们日渐关注的研究课题。然而,想要在测验中充分利用反应时信息,首要问题就是建立合适的反应时测量模型。在项目反应理论(IRT)领域,反应时相关的模型研究已有较长的发展历史。包括:参考针对作答精度(RA)构建的传统项目反应模型的参数设置,对反应时进行单独建模;将项目反应参数加入到反应时模型中,以获得更精确的被试反应时参数的估计;为了获得更精确的被试参数的估计,将反应时参数构建在传统的项目反应模型中等,诸多研究成果不胜枚举。然而,这些模型的开发与应用更多集中在单维测验,对于考虑反应时的多维测量具有诸多限制,而能够应用于多维测验的传统多维项目反应模型(如,M3PL等)又忽略了反应时信息,无法同时处理被试的作答数据和反应时数据。因此,开发一个适用于多维测验且能够同时分析被试作答反应数据和反应时信息的多维项目反应模型具有十分重要的意义。鉴此,本研究的目的是开发一个包含个体作答反应时的多维项目反应模型。采用基于汉密尔顿蒙特卡罗(Hamiltonian Monte Carlo,HMC)抽样算法的贝叶斯马尔科夫链蒙特卡罗(Bayesian Markov Chain Monte Carlo,MCMC)方法对模型进行参数估计。分别利用基于真实数据的研究和两类基于模拟数据的研究,对本文提出模型的适用性和参数估计的稳健性进行了验证与评估。研究结果表明:(1)加入反应时信息的M4PL-RT在理论上更加符合真实的多维测量情境。(2)在真实数据研究中新开发的模型相比较其他几个传统的IRT模型显示出了更好的拟合表现。(3)相比较传统多维项目反应模型M3PL,加入反应时信息的M4PL-RT模型能够为被试提供更多的测量信息量,也就是说能够为被试提供更高的测量精度。(4)在基于真实数据的模拟研究中,M4PL-RT模型的被试参数与项目参数均显示出了良好的参数估计返真性。(5)在采用2×2×3完全随机实验设计的纯模拟数据研究中,M4PL-RT在12个条件下均表现出了理想的参数估计返真性。本研究提出的结合反应时的多维项目反应模型对估计个体的潜在参数具有重要的理论和实践意义。此外,本文也进一步讨论了提出模型的几个潜在的应用方向以及最后介绍了未来进一步改良与完善的研究展望。
朱琳[9](2020)在《基于CTT和IRT的慢性乙肝患者生命质量量表(CHBQOL)的研制与测量性能评价》文中研究指明研究背景和目的我国是乙肝流行最高的国家之一,慢性乙肝的病程进展及长期治疗造成的经济负担严重影响患者的日常生活。此外,我国患者还报告较多的自卑、焦虑、受歧视、工作能力降低等社会心理问题。健康相关生命质量是评价人群健康状态、疾病干预和治疗效果的一个重要测量指标,拓展了传统临床只关注诊断和躯体症状的局限。目前尚缺乏基于我国文化背景开发的非肝硬化慢性乙肝患者生命质量评估的工具。本研究旨在通过深入访谈构建我国文化背景下慢性乙肝患者生命质量概念框架,综合运用经典测量理论和项目反应理论系统性地研制适用于慢性乙肝患者的疾病特异性生命质量量表及其核心简表,并提供充分的测量性能和实证证据,为人群研究和临床实践充分评估这一人群的疾病负担和治疗效果提供适宜的评价工具,实现以患者为中心的卫生服务目标。研究方法本研究共分为3个研究阶段:阶段一为发展CHBQOL初始量表。以马斯洛需要层次理论为基础,运用扎根理论的定性研究技术,按饱和抽样原则对94位慢性乙肝患者进行深入访谈,探索与疾病相关的生活感受、目标、关心和忧虑。通过3轮患者认知访谈测试初始条目语言的适宜性、内容理解的正确性和接受度并进行相应的修改。运用离散趋势法、因子分析法、相关系数法和克隆巴赫α系数法等定量统计学方法进行条目筛选,保留合格条目构建CHBQOL量表。阶段二为评价CHBQOL量表的测量性能。本研究于2017年6月至2018年2月采用定额抽样的方法在浙江省6家三级医院共招募578名符合纳入排除标准的慢性乙肝患者作为研究对象,主要运用经典测量理论对CHBQOL量表进行规范的测量性能评价。本研究中信度评价采用内部一致性信度、重测信度和测量误差,为评价重测信度,随机抽取60位患者于7-10天后再次填写CHBQOL初始量表。效度评价采用内容效度、结构效度(包括聚合区分效度)、准则效度和已知群效度。使用SF-36量表得分作为效标。反应度评价采用纵向研究设计,邀请所有参与横断面调查的研究对象于1年后再次进行生命质量、人口学特征及临床信息的采集,计算效应量和标准化反应均数。使用不同人群量表分数分布及最小重要性差异值来评价可解释性。阶段三为研制核心简表CHBQOL-SF。本研究运用项目反应理论在原量表基础上发展简表,针对有序多级计分条目采用Rasch模型中分部评分模型对横断面样本数据进行模型拟合。通过项目特征曲线、项目信息函数、条目拟合情况、类别概率曲线、阈值参数、项目功能差异分析、个体-条目图等进一步筛选条目。结合条目内容和专家对条目的重要性评分情况,形成最终简表,并进行模型拟合评价。本研究采用Epidata软件进行数据录入,描述性统计分析根据数据变量资料选用例数(百分比)、均数±标准差、变异系数等进行描述;变量间相关采用Pearson和Spearman相关系数;组间差异比较视变量类型选用t检验、方差分析和卡方检验等,验证性因子分析采用Amos 20.0软件,IRT分析采用RUMM2030软件,其余分析均采用SPSS 20.0软件。研究结果1)本研究通过对访谈转录文本进行编码和主题分析,构建了中国文化背景下慢性乙肝患者生命质量概念框架,形成了30个初始条目,认知访谈确定了量表的条目选项为Likert 6点评分形式。经经典测量理论进行条目筛选后,最终形成了包含躯体健康、情绪症状、信念和社会污名4个维度共24条目的CHBQOL量表。2)研究对象的SF-36生理和心理领域总得分均低于杭州市常模人群,慢性乙肝患者生命质量较低。CHBQOL量表具有较好的内部一致性信度,各维度Cronbach’sα系数均>0.7,除信念维度组内相关系数为0.53较低外,其余维度重测信度较好,躯体健康维度的测量误差最小。量表各维度得分均不存在天花板和地板效应。CHBQOL量表平均测评时间为3.8分钟,可认为量表具有较好的可行性。验证性因子分析结果证实量表具有较好的结构效度,各因子载荷范围为0.54~0.90,模型拟合指数理想(?2/df=2.19,GFI=0.87,CFI=0.92,RMSEA=0.06,SRMR=0.05)。CHBQOL与SF-36各维度呈中低程度相关,且相关系数在测量相似概念的可类比维度间更大,证实CHBQOL具有较好的效标效度。已知群效度结果验证了生命质量得分在性别、年龄、经济收入等方面的研究假设,但未能发现肝功能受损的患者在CHBQOL躯体健康维度的得分有显着降低。经过一年慢性乙肝抗病毒治疗,总体上慢性乙肝患者的生命质量得分均值在躯体健康、信念和社会污名维度的差异有统计学意义(P<0.05),但各维度的效应量和标准化反应均数大小均在0.2左右,表明CHBQOL量表的反应度有待进一步提高。本研究最终确定的躯体健康、情绪症状、信念和社会污名维度的最小重要性差异值分别为9.0,-12.0,-20.0和12.0。3)经专家德尔菲法和项目反应理论进一步精简条目,最终形成的核心简表CHBQOL-SF保留了原量表维度结构,共10个条目。条目拟合残差绝对值均<2.5,表明条目拟合良好,各条目均不存在逆反阈值,显示条目选项设置合理。条目BE1、SO6、SO7分别在不同ALT水平、年龄和性别上存在一致性项目功能差异。研究结论本研究依据量表系统开发程序研制的疾病特异性慢性乙肝患者生命质量测评量表(CHBQOL)经验证具有较好的信度、效度,反应度有待进一步观察和提高,适合用于评价中国文化背景下的慢性乙肝患者生命质量。基于锚法和分布法制定的最小重要性差异值为患者生命质量得分的变化提供了较好的可解释性。10条目核心简表(CHBQOL-SF),保留了原量表维度结构,将进一步减轻测量负担,促进生命质量测评在临床实践中的发展。
陆婧[10](2019)在《基于反应时间过程数据的项目反应建模及其应用》文中进行了进一步梳理随着现代科学信息技术的发展,教育和心理评估的测试逐渐由传统的纸笔考试(paper-and-pencil tests)转变为基于计算机平台的测验(computer-based assessments)。随着计算机化测验的广泛应用,记录并呈现学生在题目上的反应过程的信息变得十分容易。学生在题目上表现的作答信息即反应过程数据,被记录到计算机后台的日志文件中。反应过程数据包括反应时间数据,行为过程数据,以及有序数据等。反应过程数据的记录为心理测量学家和统计研究人员更深入的探究学生的反应行为以及更精准的估计被试的能力提供了重要的保证。反应过程数据的应用包括以下几个方面:探测被试的考试行为(例如,快速猜测行为和考试欺骗行为),甄别测验的执行问题(例如,识别题目上的实际所用的反应时间比预期的反应时间更长的被试组),识别测验的加速及疲劳现象,研究不同国家的考试时间分配的差异,检验题目位置的设置的影响,探究不同年龄段的被试在处理信息的速度上的差异、并对影响因素进行分析等;其中有序信息可以提供被试在测验上的进展情况,例如题目被重新访问的次数,被试点击鼠标的次数或拖拽鼠标的次数和时间,以及被试作答题目的轨迹等。同时利用作答的有序信息和反应时间可以帮助测验分析人员识别出有问题的题目,单元,被试群组等。由于反应时间本质上刻画的是被试对信息加工处理的过程,本文主要针对反应时间过程数据进行探究,将反应时间过程数据作为辅助信息加入到项目反应理论的研究中,致力于解决测验中出现的若干个实际应用问题。本文针对考生的异常考试行为,提出了一个带有高阶能力结构的反应和反应时间的混合模型用于探测快速猜测行为,加入多个子测验的辅助信息,同时考虑了多维能力间的相关性,从而更有效地探测快速猜测行为。使用马尔科夫链蒙特卡罗方法对构建的模型进行参数估计。模拟研究证实相比于传统的单维混合模型,新模型的参数估计有更小的绝对偏差和均方误差,并且新模型可以保证有更高的正确探测率和更低的错误探测率。此外,偏差信息准则和伪边际似然的对数准则用于评估模型的拟合情况。最后,一个实际数据的分析表明我们提出模型的实际应用价值。大规模的测验数据中普遍存在反应的缺失数据。本文首次利用反应时间数据同时解释测验中经常出现的两类缺失数据,即未达到的缺失反应和中间跳过的缺失反应。针对由于测验的时间限制而产生的未达到的缺失反应,我们发现常规的反应时间模型可以用于解释这类缺失数据。针对测验的中间跳过的缺失反应,我们提出了一个反应时间过程模型,该模型可以提供关于被试的潜在行为过程的解释。我们采用马尔科夫链蒙特卡洛方法对构建的新模型进行参数估计。利用贝叶斯信息准则对实际数据进行拟合,实际数据的分析验证了反应时间过程模型的应用价值。模拟研究进一步探究了当数据中同时存在两类缺失数据时,我们提出的反应时间过程模型的使用优势。反应时间过程数据是考试数据的重要组成部分,该数据的记录为测验分析人员研究考生的解题过程提供了重要的辅助信息。本文基于反应时间过程数据,针对实际数据中出现的若干个测验问题,分别建立了相应的统计模型,模型能够对考生的行为过程做出合理的解释和推断,从而提高被试能力估计的准确性和精度,为后续的决策提供重要的参考依据和保障。
二、IRT:理论与应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、IRT:理论与应用(论文提纲范文)
(1)估计潜变量分布IRT模型的应用 ——以蒙特利尔认知评估量表为例(论文提纲范文)
摘要 |
Abstract |
1 前言 |
2 文献综述 |
2.1 潜在特质正态分布假设下的项目反应函数 |
2.2 估计潜变量分布的IRT模型 |
2.2.1 EH与EHW模型 |
2.2.2 DC-IRT模型 |
2.2.3 其他估计潜变量分布的IRT模型 |
2.3 蒙特利尔认知评估量表的IRT分析 |
3 研究构思 |
3.1 问题提出 |
3.2 研究目标 |
3.3 研究总体框架 |
3.4 研究意义 |
3.4.1 理论意义 |
3.4.2 实践意义 |
4 研究一正态与非正态潜在特质分布下模型拟合比较 |
4.1 DC-IRT(k=2,…,10)模型、EH模型和EHW模型参数返真性 |
4.1.1 研究目的 |
4.1.2 研究方法 |
4.1.2.1 研究程序 |
4.1.2.2 研究工具 |
4.1.2.3 评价指标 |
4.1.3 研究结果 |
4.2 DC-IRT(k=2,…,10)模型、EH模型和EHW模型拟合优度比较 |
4.2.1 研究目的 |
4.2.2 研究方法 |
4.2.2.1 研究程序 |
4.2.2.2 研究工具 |
4.2.2.3 评价指标 |
4.2.3 研究结果 |
4.2.3.1 被试潜在特质为正态分布时的结果 |
4.2.3.2 被试潜在特质为非正态分布时的结果 |
4.3 讨论与小结 |
5 研究二估计潜变量分布IRT模型在MoCA数据分析中的应用:模型比较及项目参数估计 |
5.1 研究目的 |
5.2 研究方法 |
5.2.1 数据来源 |
5.2.2 研究工具 |
5.2.3 数据处理 |
5.3 研究结果 |
5.4 讨论与小结 |
6 研究三估计潜变量分布IRT模型在MoCA数据分析中的应用:被试能力的估计 |
6.1 研究目的 |
6.2 研究方法 |
6.2.1 数据来源 |
6.2.2 研究工具 |
6.2.3 数据处理 |
6.3 研究结果 |
6.4 讨论与小结 |
7 综合讨论 |
8 总结论 |
8.1 结论 |
8.2 不足之处及展望 |
参考文献 |
附录 |
致谢 |
(2)分位数多水平项目反应理论及异常反应行为研究(论文提纲范文)
摘要 |
Abstract |
绪论 |
第一部分 分位数多水平项目反应理论 |
第一章 引言 |
第二章 模型的建立与估计 |
2.1 分位数多水平项目反应理论模型 |
2.2 贝叶斯分析 |
2.3 模拟研究 |
第三章 实例分析和总结 |
3.1 实例分析 |
3.2 总结 |
第二部分 异常反应行为研究 |
第四章 引言 |
第五章 变点分析方法和反应时间模型 |
5.1 变点分析方法 |
5.2 反应时间模型 |
第六章 方法的提出 |
6.1 异常反应行为对MLIRT和 Q-MLIRT模型参数估计的影响 |
6.2 贝叶斯变点分析方法 |
6.3 模拟研究 |
第七章 实例分析和总结 |
7.1 实例分析 |
7.2 总结 |
总结与讨论 |
参考文献 |
致谢 |
在学期间公开发表及投稿论文情况 |
(3)项目反应理论在患者报告结局测量工具研究中的应用及展望(论文提纲范文)
1 项目反应理论概述 |
1.1 项目反应理论的相关概念 |
1.2 项目反应理论模型的假设 |
1.3 项目反应理论的特点和优势 |
1.4 常用的项目反应理论模型 |
2 项目反应理论在患者报告结局测量工具研究中的应用 |
2.1 用于测量工具评价和优化 |
2.2 用于测量工具的测量等价性分析 |
2.3 用于实现不同测量工具间的可比性 |
2.4 用于CATs的构建 |
3 IRT应用于患者报告结局工具的展望 |
3.1 多维项目反应理论的发展促进真实世界的患者报告结局研究 |
3.2 基于IRT的计算机自适应测试技术促进精准测量 |
4 小结 |
(4)项目反应理论框架下的运动神经元病患者报告结局评价量表研究(论文提纲范文)
摘要 |
ABSTRACT |
英文缩略语 |
综述一 运动神经元病临床评价研究进展 |
1. 主要评价指标 |
2. 展望 |
参考文献 |
综述二 心理测量学及其在医学领域应用中的优势 |
1. 观察法与量表法 |
2. 经典测量理论 |
3. 项目反应理论 |
4. 多维项目反应理论 |
5. 心理测量学在医学量表中的应用 |
参考文献 |
前言 |
第一部分 ALSFRS-R在不同文化背景下的IRT分析 |
1.1 研究背景与目的 |
1.2 研究流程图 |
1.3 对象与方法 |
1.3.1 研究对象 |
1.3.2 研究方法 |
1.4 结果 |
1.4.1 倾向性评分配对 |
1.4.2 ALSFRS-R量表的天花板效应和地板效应 |
1.4.3 ALSFRS-R量表IRT模型选择及假设检验 |
1.4.4 ALSFRS-R量表的项目特征曲线及参数估计 |
1.4.5 ALSFRS-R量表项目功能差异分析 |
1.5 小结 |
1.5.1 讨论 |
1.5.2 结论 |
第二部分 基于MIRT模型的MND-PRO量化分析 |
2.1 研究基础与研究目的 |
2.2 研究流程图 |
2.3 对象与方法 |
2.3.1 研究对象 |
2.3.2 研究方法 |
2.4 结果 |
2.4.1 MND-PRO量表的天花板效应和地板效应 |
2.4.2 基于多维项目反应理论的MND-PRO量表考评 |
2.4.3 MND-PRO量表的效标关联效度分析 |
2.5 小结 |
2.5.1 讨论 |
2.5.2 结论 |
第三部分 基于MND-PRO量表的疾病演变模式初探 |
3.1 研究背景与目的 |
3.2 研究流程图 |
3.3 对象与方法 |
3.3.1 研究对象 |
3.3.2 数据收集 |
3.3.3 研究方法 |
3.4 结果 |
3.4.1 NfL的项目功能差异分析 |
3.4.2 中医辨证的项目功能差异分析 |
3.5 小结 |
3.5.1 讨论 |
3.5.2 结论 |
结语 |
1. 结论 |
1.1 ALSFRS-R量表在中国MND患者中存在局限性 |
1.2 中国MND患者的疾病特点 |
1.3 MND-PRO量表具有优势且适用于中国人群 |
1.4 NfL与疾病演变和预后的关系 |
1.5 中医MND证候特征的应用及启示 |
2. 创新性 |
3. 不足与展望 |
参考文献 |
致谢 |
附录 |
在学期间主要研究成果 |
个人简历 |
(5)宫颈癌患者治疗期症状评估量表的开发及初步应用(论文提纲范文)
中文摘要 |
Abstract |
缩略语/符号说明 |
前言 |
研究背景、成果 |
1. 研究背景 |
2. 宫颈癌症状评估量表的现状 |
2.1 治疗相关毒性反应评估量表 |
2.1.1 急性放射反应评分标准 |
2.1.2 不良事件通用术语标准3.0 |
2.1.3 正常组织迟发不良反应判定系统 |
2.2 症状评估量表 |
2.2.1 记忆症状评估量表 |
2.2.2 埃德蒙顿症状评估系统 |
2.2.3 安德森症状评估量表 |
2.3 生活质量量表 |
2.3.1 宫颈癌治疗功能评价系统 |
2.3.2 欧洲癌症研究与治疗组织的生存质量宫颈癌特异性模块 |
2.3.3 癌症患者生命质量测定量表体系之宫颈癌量表 |
3. 测量学理论概述 |
3.1 经典测量理论 |
3.2 现代测量理论 |
研究目的、方法 |
4.1 研究目的 |
4.2 理论框架 |
4.3 研究内容 |
第一部分 宫颈癌症状评估量表的开发 |
1.1 研究设计 |
1.2 理论框架 |
1.3 研究对象 |
1.3.1 研究对象 |
1.3.2 纳入排除标准 |
1.4 研究方法 |
1.4.1 组建量表研究小组 |
1.4.2 建立条目池 |
1.4.3 确定咨询专家 |
1.4.4 条目的筛选、删减和修改 |
1.4.5 预调查 |
1.5 质量控制 |
1.5.1 建立条目池 |
1.5.2 资料收集阶段 |
1.5.3 资料录入分析阶段 |
1.6 结果 |
1.6.1 条目池建立 |
1.6.2 条目初步筛选 |
1.6.3 预调查结果 |
1.7 讨论 |
1.8 小结 |
第二部分 宫颈癌患者治疗期症状评估量表的测评 |
2.1 研究设计 |
2.2 经典测量理论 |
2.2.1 基本思想 |
2.2.2 CTT的三个假设 |
2.2.3 相关概念 |
2.2.4 CTT的优势与局限性 |
2.3 项目反应理论 |
2.3.1 概述 |
2.3.2 基本原理 |
2.3.3 相关概念 |
2.3.4 IRT的理论假设 |
2.3.5 常用模型 |
2.3.6 参数估计 |
2.3.7 IRT的优势与不足 |
2.4 研究对象 |
2.4.1 研究对象 |
2.4.2 纳入排除标准 |
2.4.3 样本量计算 |
2.5 研究工具 |
2.5.1 一般资料调查问卷 |
2.5.2 宫颈癌患者治疗期症状评估量表 |
2.5.3 中文版记忆症状评估量表 |
2.6 测量学特性考评 |
2.6.1 统计统计 |
2.6.2 测量学特性考评 |
2.7 质量控制 |
2.8 结果 |
2.8.1 研究对象的一般资料 |
2.8.2 量表的可行性 |
2.8.3 信度测评 |
2.8.4 效度测评 |
2.8.5 单维性测评 |
2.8.6 宫颈癌患者治疗期症状评估量表的IRT分析 |
2.9 讨论 |
2.9.1 量表的接受度和可行性 |
2.9.2 信度测评 |
2.9.3 效度测评 |
2.9.4 宫颈癌患者治疗期症状评估量表的项目参数 |
2.9.5 宫颈癌患者治疗期症状评估量表的项目特征曲线和信息曲线 |
2.10 小结 |
第三章 宫颈癌患者治疗期症状评估量表的初步应用 |
3.1 理论依据 |
3.1.1 症状管理 |
3.1.2 症状群 |
3.2 研究对象 |
3.2.1 研究对象 |
3.2.2 纳入标准 |
3.2.3 排除标准 |
3.2.4 样本量计算 |
3.3 研究工具 |
3.3.1 一般资料调查问卷 |
3.3.2 宫颈癌患者治疗期症状评估量表 |
3.4 资料收集方法 |
3.5 统计学方法 |
3.5.1 统计描述 |
3.5.2 探索性因子分析 |
3.5.3 症状群在不同组别患者中的比较 |
3.6 质量控制 |
3.6.1 资料收集阶段 |
3.6.2 资料录入分析阶段 |
3.7 结果 |
3.7.1 研究对象的一般资料 |
3.7.2 症状的发生频率和严重程度 |
3.7.3 症状群 |
3.7.4 症状群在不同组别患者中的比较 |
3.8 讨论 |
3.8.1 宫颈癌患者放疗期间症状的发生情况 |
3.8.2 宫颈癌患者放疗期间的症状群 |
3.8.3 症状群在不同组别患者中的比较 |
3.9 小结 |
全文结论 |
论文创新点 |
参考文献 |
发表论文和参与科研情况说明 |
附录 |
综述 宫颈癌症状管理的研究进展 |
综述参考文献 |
致谢 |
个人简历 |
(6)基于贝叶斯广义分部评分模型以及OBID方法的普适性癌症PRO量表研制与评价(论文提纲范文)
摘要 |
ABSTRACT |
常用缩写词中英文对照表 |
第一部分 前言 |
1.1 癌症的临床流行病学特征 |
1.2 患者结局报告(PRO)量表 |
1.3 癌症PRO量表的国内外研究现状分析 |
第二部分 普适性癌症量表的初阶段 |
2.1 临床调查 |
2.1.1 伦理认可 |
2.1.2 病例来源 |
2.1.3 病例选择 |
2.1.4 样本含量的确定 |
2.1.5 质量控制 |
2.2 量表研制的原则和步骤 |
2.2.1 癌症普适性量表研制的技术路线 |
2.2.2 成立研究小组 |
2.2.3 量表理论框架的建立 |
2.2.4 量表内容和条目计分 |
2.2.5 患者访谈 |
2.2.6 认知测试与专家评价 |
2.2.7 数据的预处理 |
2.3 讨论 |
2.4 结论 |
第三部分 经典测验理论 |
3.1 经典测验理论下的条目筛选方法 |
3.1.1 条目分布考察法 |
3.1.2 离散趋势法(变异系数法) |
3.1.3 探索性因子分析法 |
3.1.4 克朗巴赫系数法 |
3.1.5 相关系数法 |
3.1.6 变量聚类分析法 |
3.2 结果与分析 |
3.2.1 基线资料的描述性分析 |
3.2.2 条目的筛选 |
3.3 讨论 |
3.4 结论 |
第四部分 项目反应理论 |
4.1 理论与方法 |
4.2 IRT所需的样本量 |
4.3 结果与分析 |
4.3.1 单维性和局部独立性检验 |
4.3.2 呼吸系统的IRT分析 |
4.3.3 消化系统的IRT分析 |
4.3.4 血液系统的IRT分析 |
4.3.5 内分泌系统的IRT分析 |
4.4 讨论 |
4.5 结论 |
第五部分 量表的评价 |
5.1 信度评价 |
5.2 效度分析 |
5.2.1 内容效度 |
5.2.2 结构效度 |
5.2.3 BID (Bayesian Instrument Development)方法 |
5.2.4 区分度分析 |
5.3 可行性分析 |
5.3.1 回收率 |
5.3.2 完成率 |
5.3.3 作答时间 |
5.4 讨论 |
5.5 结论 |
第六部分 最小临床意义变化值 |
6.1 MCID的理论和方法 |
6.2 结果与分析 |
6.3 讨论 |
6.4 结论 |
第七部分 基于癌症普适性PRO量表确定的疾病风险临界值 |
7.1 研究意义 |
7.2 方法 |
7.2.1 研究样本 |
7.2.2 数据的预处理 |
7.2.3 统计分析方法 |
7.3 结果与分析 |
7.3.1 各组别的描述性分析结果 |
7.3.2 潜在剖面分析 |
7.3.3 验证潜在分类的合理性 |
7.3.4 确定PRO风险临界值 |
7.4 讨论 |
7.5 结论 |
全文结论 |
参考文献 |
第八部分 全文程序 |
综述 |
参考文献 |
附录 |
致谢 |
个人简介 |
(7)基于EM算法的IRT模型参数估计及应用研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 主要研究内容及创新点 |
1.3.1 主要研究内容 |
1.3.2 本文的创新点 |
1.4 论文结构安排 |
第2章 相关理论和技术 |
2.1 项目反应理论 |
2.1.1 项目反应理论概述 |
2.1.2 项目反应模型 |
2.1.3 项目反应模型参数估计算法 |
2.2 EM算法 |
2.2.1 EM算法背景 |
2.2.2 算法基本原理 |
2.2.3 EM算法的优劣势 |
2.3 本章小结 |
第3章 基于EM算法的IRT模型参数估计的实现 |
3.1 EM算法估计IRT模型的过程 |
3.1.1 算法中的符号表示 |
3.1.2 EM算法估计IRT的推导过程 |
3.2 EM算法估计IRT模型的实现 |
3.2.1 算法实现的影响因素分析 |
3.2.2模拟实验 |
3.2.3 EM算法参数估计的准确性 |
3.3 基于EM算法改进的PE-PM算法 |
3.3.1 EM算法并行的可行性分析 |
3.3.2 PE-PM算法的技术支持 |
3.3.3 实验结果 |
3.4 潜变量的估计 |
3.4.1 EAPE法估计潜变量 |
3.4.2 潜变量估计结果 |
3.5 本章小结 |
第4章 不同特征数据对IRT模型参数估计的影响 |
4.1 区域数据与整体数据对项目参数估计的影响 |
4.1.1模拟实验 |
4.1.2 实验结果分析 |
4.1.3 实验意义 |
4.2 异常数据对参数估计的影响 |
4.2.1 实验设计 |
4.2.2 实验结果分析 |
4.2.3 异常数据检测 |
4.3 本章小结 |
第5章 基于EM算法的IRT模型在考试数据分析中的应用 |
5.1 数据预处理 |
5.1.1 数据标准化转换 |
5.1.2 异常数据检测 |
5.2 基于EM算法的IRT模型参数估计分析 |
5.3 试卷与被试水平匹配分析 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 论文总结 |
6.2 研究展望 |
参考文献 |
攻读学位期间的论文发表情况 |
致谢 |
(8)结合反应时的多维项目反应模型的开发与验证(论文提纲范文)
摘要 |
Abstract |
引言 |
1 文献综述 |
1.1 项目反应建模 |
1.1.1 标准项目反应模型 |
1.1.2 结合反应时的项目反应模型 |
1.2 反应时建模 |
1.2.1 标准反应时模型 |
1.2.2 结合项目反应的反应时模型 |
1.3 小结 |
2 研究内容与设计 |
2.1 研究目的与研究框架 |
2.2 研究意义 |
2.2.1 理论意义 |
2.2.2 实践意义 |
3 研究一:结合反应时的多维项目反应理论模型的开发 |
3.1 研究目的 |
3.2 M4PL-RT模型的开发 |
3.2.1 M4PL-RT模型介绍 |
3.2.2 M4PL-RT模型与传统模型的关系 |
3.2.3 M4PL-RT的贝叶斯参数估计 |
3.3 研究小结 |
4 研究二:M4PL-RT模型在MBTI量表中的应用及其与传统模型的比较研究 |
4.1 研究目的 |
4.2 研究方法 |
4.2.1 数据描述 |
4.2.2 数据分析和模型选择 |
4.2.3 M4PL-RT与 M3PL的模型比较 |
4.3 研究结果 |
4.3.1 MCMC参数估计收敛性分析 |
4.3.2 真实数据分析的研究结果 |
4.3.3 M3PL与 M4PL-RT的模型比较 |
4.4 研究小结 |
5 研究三:基于真实数据模拟的M4PL-RT模型参数估计精度验证 |
5.1 研究目的 |
5.2 研究方法 |
5.2.1 多维对数反应时模型 |
5.2.2 数据生成 |
5.2.3 参数估计和数据分析 |
5.2.4 实验流程 |
5.3 评价指标 |
5.4 研究结果 |
5.5 研究小结 |
6 研究四:基于纯模拟的M4PL-RT模型参数估计精度验证 |
6.1 研究目的 |
6.2 研究设计 |
6.3 研究过程 |
6.3.1 数据生成 |
6.3.2 参数估计和数据分析 |
6.3.3 实验流程 |
6.4 评价指标 |
6.5 研究结果 |
6.6 研究小结 |
7 研究总结与讨论 |
7.1 研究结论 |
7.2 讨论与展望 |
参考文献 |
附录 |
致谢 |
在读期间公开发表论文(着)及科研情况 |
(9)基于CTT和IRT的慢性乙肝患者生命质量量表(CHBQOL)的研制与测量性能评价(论文提纲范文)
致谢 |
中文摘要 |
Abstract |
常用缩略词中英文对照 |
第1章 绪论 |
1.1 研究背景 |
1.1.1 慢性乙肝患者生命质量测量的重要性 |
1.1.2 HRQoL评价工具及其应用现状 |
1.1.3 项目反应理论在HRQoL研究中的应用 |
1.2 研究目的与意义 |
1.2.1 研究目的 |
1.2.2 研究意义 |
1.3 研究内容 |
1.4 技术路线 |
第2章 资料与方法 |
2.1 数据来源 |
2.1.1 研究现场 |
2.1.2 研究对象 |
2.1.3 样本量 |
2.1.4 数据收集 |
2.1.5 调查工具 |
2.2 理论与方法学基础 |
2.2.1 生命质量测量的基本理论 |
2.2.2 条目发展的理论基础 |
2.2.3 HRQoL量表研制的标准程序 |
2.3 条目筛选的方法 |
2.3.1 专家函询法 |
2.3.2 基于CTT的统计学方法 |
2.3.3 基于IRT的筛选方法 |
2.4 量表测量性能评价的内容与方法 |
2.4.1 可行性 |
2.4.2 信度 |
2.4.3 效度 |
2.4.4 反应度 |
2.4.5 最小重要性差异值 |
2.5 数据处理与分析 |
2.5.1 缺失值的处理 |
2.5.2 数据分析 |
2.6 质量控制 |
2.6.1 数据收集阶段 |
2.6.2 数据处理阶段 |
2.6.3 伦理学原则 |
第3章 CHBQOL量表的研制过程 |
3.1 确立量表研制的工作小组 |
3.2 构建CHB患者生命质量概念框架 |
3.3 初始条目内容的发展 |
3.4 认知访谈 |
3.5 条目筛选结果 |
3.5.1 条目得分的分布情况 |
3.5.2 克隆巴赫α系数法、相关系数法和t检验结果 |
3.5.3 探索性因子分析结果 |
3.6 形成CHBQOL量表 |
第4章 CHBQOL量表的测量性能评价结果 |
4.1 研究对象的一般情况 |
4.1.1 患者的人口学特征和临床基本信息 |
4.1.2 研究对象的生命质量情况 |
4.2 可行性分析 |
4.3 信度分析 |
4.3.1 内部一致性信度 |
4.3.2 重测信度 |
4.3.3 测量误差 |
4.4 效度分析 |
4.4.1 内容效度 |
4.4.2 结构效度 |
4.4.3 聚合和区分效度 |
4.4.4 效标效度 |
4.4.5 已知群效度 |
4.5 反应度分析 |
4.5.1 研究对象随访情况 |
4.5.2 慢乙肝患者生命质量变化情况 |
4.6 最小重要性差异值的制定 |
第5章 CHBQOL-SF核心简表的研制 |
5.1 基于德尔菲法的条目重要性评分筛选 |
5.1.1 专家基本情况 |
5.1.2 专家积极性 |
5.1.3 专家权威程度 |
5.1.4 专家意见集中度和协调程度 |
5.1.5 条目筛选结果 |
5.2 基于项目反应理论的条目筛选 |
5.2.1 单维性检验 |
5.2.2 项目特征曲线和项目信息曲线形式检验 |
5.2.3 条目的难度分析 |
5.2.4 项目功能差异分析 |
5.2.5 条目筛选结果 |
5.3 CHBQOL-SF的综合评价 |
第6章 讨论 |
6.1 关于CHBQOL量表内容与结构 |
6.2 关于CHBQOL量表的测量性能 |
6.3 关于量表研制中的条目筛选方法 |
6.4 关于IRT分析 |
6.5 研究创新点与特色 |
6.6 研究局限性 |
6.7 政策建议 |
6.8 结论 |
参考文献 |
综述 项目反应理论在健康相关量表研究中的应用进展 |
参考文献 |
附录 |
(10)基于反应时间过程数据的项目反应建模及其应用(论文提纲范文)
中文摘要 |
Abstract |
第一章 引言 |
1.1 项目反应理论的介绍和发展 |
1.2 项目反应理论的基本假设和常用模型 |
1.3 项目反应理论模型的参数估计方法 |
1.4 反应过程数据的收集和研究 |
1.5 本文的主要工作和结构安排 |
第二章 探测快速猜测行为的带有高阶能力结构的反应和反应时间的混合模型 |
2.1 研究概述 |
2.2 研究背景 |
2.3 高阶混合反应和反应时间模型的构建 |
2.3.1 模型构建的动机 |
2.3.2 高阶潜在特质模型 |
2.3.3 反应和反应时间的混合模型 |
2.3.4 分层模型框架 |
2.4 贝叶斯推断 |
2.4.1 参数估计 |
2.4.2 模型选择的方法 |
2.5 模拟研究 |
2.5.1 模拟研究设计 |
2.5.2 参数真值的选取 |
2.5.3 模拟研究中的因素的设置 |
2.5.4 模拟研究Ⅰ |
2.5.5 模拟研究Ⅱ |
2.5.6 模拟研究Ⅲ |
2.6 模拟研究结果 |
2.6.1 模拟研究I的结果 |
2.6.2 模拟研究II的结果 |
2.6.3 模拟研究III的结果 |
2.7 实际数据分析 |
2.7.1 数据分析 |
2.7.2 数据分析的结果 |
2.8 研究小结 |
第三章 解释不可忽略的两类缺失数据的反应时间过程模型 |
3.1 研究概述 |
3.2 研究背景和研究动机 |
3.3 模型及其原理 |
3.3.1 未达到题目的反应时间模型 |
3.3.2 中间跳过的题目的反应时间过程模型 |
3.3.3 参数估计 |
3.4 PISA数据分析 |
3.4.1 探索性分析 |
3.4.2 模型拟合 |
3.4.3 模型参数估计的结果 |
3.5 模拟研究 |
3.5.1 数据的产生 |
3.5.2 模型参数的估计 |
3.5.3 模拟研究的结果 |
3.6 模拟小结 |
第四章 总结与展望 |
4.1 研究总结 |
4.2 研究局限和展望 |
第五章 附录 |
5.1 带有高阶能力结构的混合模型的参数估计的抽样步骤 |
5.2 反应时间过程—3PL模型的参数估计的抽样步骤 |
5.3 Holman和 Glas(2005)的反应时间扩展模型的参数估计的抽样步骤 |
参考文献 |
致谢 |
在学期间公开发表及投稿论文情况 |
四、IRT:理论与应用(论文参考文献)
- [1]估计潜变量分布IRT模型的应用 ——以蒙特利尔认知评估量表为例[D]. 岳通. 曲阜师范大学, 2021(02)
- [2]分位数多水平项目反应理论及异常反应行为研究[D]. 朱红月. 东北师范大学, 2021(09)
- [3]项目反应理论在患者报告结局测量工具研究中的应用及展望[J]. 吴傅蕾,黄青梅,杨瑒,蔡婷婷,袁长蓉. 护士进修杂志, 2021(05)
- [4]项目反应理论框架下的运动神经元病患者报告结局评价量表研究[D]. 韩奕. 北京中医药大学, 2020(04)
- [5]宫颈癌患者治疗期症状评估量表的开发及初步应用[D]. 魏思琪. 天津医科大学, 2020(06)
- [6]基于贝叶斯广义分部评分模型以及OBID方法的普适性癌症PRO量表研制与评价[D]. 胡晓娟. 山西医科大学, 2020
- [7]基于EM算法的IRT模型参数估计及应用研究[D]. 孔亚鑫. 山东师范大学, 2020(09)
- [8]结合反应时的多维项目反应模型的开发与验证[D]. 刘思杨. 江西师范大学, 2020(12)
- [9]基于CTT和IRT的慢性乙肝患者生命质量量表(CHBQOL)的研制与测量性能评价[D]. 朱琳. 浙江大学, 2020(01)
- [10]基于反应时间过程数据的项目反应建模及其应用[D]. 陆婧. 东北师范大学, 2019(04)
标签:项目反应理论论文; 汉密尔顿焦虑量表论文; 参数估计论文; 系统评价论文; 能力模型论文;