-
临床医学专业(本科)水平测试的等值方法比较研究
编辑人员丨5天前
目的:基于经典测验理论(classical test theory,CTT)和项目反应理论(item response theory,IRT)下的等值方法对2个年度临床医学专业(本科)水平测试(简称学业水平测试)考生作答情况进行分析,探讨学业水平测试中更为适合的等值方法。方法:基于CTT方法,采用塔克(Tucker)观察分数线性等值方法、列文(Levine)观察分数线性等值方法、等百分位法、等百分位平滑法4种方法,基于IRT方法的单参数、双参数模型中,采用分别估计法、同时估计法和固定共同题参数估计法各3种校准方法进行等值探索,通过等值标准误来分析以上10种等值结果的稳定性。结果:CTT方法的等值误差在0.7~1.6之间,IRT方法的等值误差在0.2~0.6之间,IRT误差更小。CTT方法中,Tucker观察分数线性等值方法误差最小,为0.7,等百分位平滑法误差最大,为1.6;IRT方法中,单参数模型的等值结果优于双参数模型,单参数模型中,固定共同题参数估计法的误差最小,为0.2。结论:学业水平测试等值可以选择IRT单参数模型中的固定共同题参数估计法,通过等值,年度2学业水平测试等值后的分数上调,合格标准保持不变,有效地实现了分数可比,保证了考试公平。
...不再出现此类内容
编辑人员丨5天前
-
高校新生公共卫生安全素养快速测评量表编制研究
编辑人员丨5天前
目的:编制高校新生公共卫生安全素养快速测评量表。方法:采用文献研究和专家访谈法构建指标池,采用专家意见集中法遴选题项,编制初始量表,随机抽取一所高校的250名本科、硕士、博士新生进行实测。采用经典项目测验理论和项目反应理论进行题项缩减,并对另外抽取的318名新生的测试数据进行验证性因子分析。结果:量表包含3个维度9个题项,遴选内容效度均≥0.8,题项难度系数为1.18~2.43,难度指数为0.41~0.78,鉴别力指数为0.38~0.64,27%高/低分组在各题项的得分差异均 t>3,均 P<0.05。各题项的Cronbach's α值为0.72~0.77,矫正题项-总相关系数为0.33~0.60,整体 α值为0.77。因子分析各条目的荷载>0.680,因子累积方差贡献率为62.484%。验证性因子分析结果显示模型整体适配度指标除 χ2值外均达适配标准。不同人口学特征学生量表总得分和在各题项上的得分差异无统计学意义( P>0.05)。 结论:高校新生公共卫生安全素养快速测评量表信度、效度、稳定性和题项恒定性均较好,可用于高校新生公共卫生安全素养的测评。
...不再出现此类内容
编辑人员丨5天前
-
一般自我效能量表在医学研究生中的适用性评价与应用
编辑人员丨5天前
目的:利用经典测量理论和项目反应理论对一般自我效能量表(general self-efficacy scale,GSES)在医学研究生中的信度、结构效度和条目特征进行评价分析。方法:对北京市6所综合三甲医院的1 021名医学研究生进行问卷调查,内容包括一般人口学特征与一般自我效能感。利用SPSS 24.0软件进行统计分析。利用克朗巴赫系数(Cronbach’s α系数)和组内相关系数分析内部一致性,使用因子分析方法探索量表的维度结构,使用等级模型的项目反应理论对量表10个条目的难度和区分度进行参数估计。 结果:量表的整体克朗巴赫系数为0.92。平行分析主成分法和验证性因子分析均支持GSES的单维性结构。10个条目的区分度为1.82~3.65,难度为-3.51~1.66,且呈单调递增。该量表在医学研究生中的最大测验信息量为19.16。结论:一般自我效能量表具有良好的信度、结构效度和测量精度,在医学研究生调查中具有较好的适用性,但具体条目的难度偏低,可进一步优化完善。
...不再出现此类内容
编辑人员丨5天前
-
军校学员忠诚评价的内隐效应及外显测量研究
编辑人员丨2024/3/16
目的 探索军校学员内隐忠诚与外显忠诚的相关关系及其特异性,为更加全面、客观地评估个体忠诚提供理论依据和客观指标.方法 使用E-Prime2.0参照经典内隐联想范式编制内隐联想-忠诚测验对64名军校学员进行内隐忠诚测验,同时使用《中国军人忠诚量表》进行外显忠诚测量.结果 ①军校学员忠诚评价的内隐效应显著,即均倾向于认为自我的忠诚高,非自我的忠诚低.②外显忠诚测评发现:军校学员被试对党、国家和人民的忠诚得分最高(4.79±0.34),对职业的忠诚次之(4.38±0.53),对单位及领导的忠诚相对较低(4.03±0.83).在忠诚的3个维度上,规范忠诚水平最高,继续忠诚得分较低.③军人内隐忠诚与外显测量结果显示:对党、国家和人民的忠诚(r=-0.030,P=0.823)、对职业的忠诚(r=-0.047,P=0.728)、对单位的忠诚(r=0.050,P=0.710)、对领导的忠诚(r=0.043,P=0.749)相关均不显著.结论 军校学员忠诚评价的内隐效应显著,且外显测量的忠诚与内隐忠诚之间无显著相关,不能够通过单一的外显测量去判断他们的忠诚态度.
...不再出现此类内容
编辑人员丨2024/3/16
-
助产士规范化培训实践技能考试的测量学评价
编辑人员丨2023/8/6
目的:评价2016年助产士规范化培训考核实践技能考试的效果.方法:根据经典测验理论重点分析考试难度、区分度、信度、效度及考站内容相关性.结果:本次考核实践技能考试平均成绩为(72.48±8.72)分;考核总体难度为0.691,区分度为0.291,信度为0.582,均在测量学可接受的范围.考核内容效度指标(CVR)为0.90,结构效度的因素分析结果为3个维度,符合考试理论构想.各考站中第1站与第6站、第2站与第5站间存在中等程度相关,其余各考站成绩无明显相关性,说明考站内容互相独立,与考试设计符合.结论:本次考核难度适中,区分度较好,具有良好的信度和效度,能够准确地评价助产士规范化培训考核的效果,对临床实践和教学具有促进作用.
...不再出现此类内容
编辑人员丨2023/8/6
-
基于单维项目反应模型的量表评价研究
编辑人员丨2023/8/6
目的:探索应用单维项目反应模型与经典测验理论相结合的方法,解决量表评价问题.方法:对841例亚健康二手数据实证分析,进行信度、效度以及项目角度的测量学评价.结果:5个领域的克朗巴赫a系数均高于0.6,内部一致性较高;5个领域的量表结构效度较好,CFI为0.96;项目区分度>0.3,项目对所属领域诊断的灵敏度较高;量表信息量为33.8,对亚健康状态估计精度较高;但仍有部分条目需要进一步修订.结论:单维项目反应模型通过单维性、局部独立性检验,可以用来评价项目的心理学测量性能,对经典测验理论评价结果进行补充.亚健康量表信、效度较高,经IRT校正后的项目可以用于开展计算机自适应测试,进行人机交互“治未病”动态监测.
...不再出现此类内容
编辑人员丨2023/8/6
-
项目反应理论的SAS软件实现
编辑人员丨2023/8/5
项目反应理论(item response theory,IRT)是一种可以精确测量被试能力的现代测量理论,起源于20世纪30年代末;到70年代,IRT逐渐替代了传统的经典测验理论(classical test theory,CTT),成为了测验理论的重点.IRT模型的特点是建立了项目性能、被试潜在特质水平与项目应答正确概率的关系[1-2].与CTT相比,IRT中项目的难度、区分度和猜测度更为清晰、易懂,它将项目特性与被试水平定义在同一维度内,避免了对项目和被试的评价过分依赖抽样样本的局限性.目前,IRT广泛应用于各领域(特别在教育学、心理学及医学)的量表测验与计算机适应性测验等方面[3].
...不再出现此类内容
编辑人员丨2023/8/5
-
营养素养评价工具的汉化及在糖尿病患者中的信效度研究——基于CTT和Rasch模型的分析
编辑人员丨2023/8/5
背景 糖尿病是一种营养相关的慢性病,患病率和致残率均较高.因此患者对营养知识的掌握和运用能力(即营养素养)对预防和控制疾病至关重要,但国内目前尚未见有效评价工具.目的 基于经典测量理论(CTT)和项目反应理论(IRT)的Rasch分析对英文版营养素养评价工具(NLit)进行汉化并验证其信效度.方法 2018年11月—2019年5月采用方便抽样的方法选择在天津医科大学总医院内分泌科住院的325例糖尿病患者作为研究对象,采用经翻译、修订形成的中文版营养素养评价工具(CHI-NLit)进行问卷调查.结合CTT和Rasch模型分析两种测量方法对问卷进行维度划分以及内部一致性、内容效度、结构效度、效标关联效度评价.结果 残差主成分分析结果显示,CHI-NLit并非单维测验,6个分量表满足单维标准,因此保留原量表的6个维度.经Rasch模型拟合度和难度分析后,删除不达标的条目26、29、31、32,共保留38个条目形成CHI-NLit.总量表的项目信度、样本信度分别为0.919和0.838,分量表的项目信度/样本信度分别为0.928/0.681、0.902/0.690、0.948/0.679、0.932/0.651、0.960/0.601、0.928/0.683;总量表的库理信度(KR-21)为0.860,分量表的KR-21分别为0.702、0.718、0.719、0.694、0.688、0.721;总量表的重测信度为0.936,分量表重测信度分别为0.895、0.915、0.906、0.931、0.923、0.904.就效度而言,总量表内容效度指数(S-CVI)为0.905,各条目的内容效度指数(I-CVI)为0.8~1.0;各条目拟合符合Rasch模型,难度适中,结构效度较好,效标效度的Pearsen相关系数为0.784,CHI-NLit各维度得分与NVS得分呈线性正相关,绘制CHI-NLit量表预测营养素养水平的ROC曲线,ROC曲线下面积(AUC)为0.885〔95%CI(0.846,0.924)〕;当截断值为21.5分时,约登指数最大为0.623.结论 CHI-NLit具有良好的信效度,可以为糖尿病患者营养素养的测量提供参考.
...不再出现此类内容
编辑人员丨2023/8/5
-
军医大学学员坚毅性评价的内隐效应及脑电特征研究
编辑人员丨2023/8/5
目的:探寻军医大学学员内隐层面对自我和他人坚毅性评价的特点及脑电特征,为全面、客观的评估个体的坚毅性提供理论依据和客观指标.方法:使用E-Prime2.0参照经典内隐联想范式编制内隐联想-坚毅测验,对100名军医大学学员施测坚毅量表(Grit O),选取高、低坚毅水平被试(各20名)进行内隐联想-坚毅测验,并记录脑电,分析两组被试的内隐效应及主要脑电成分.结果:计算内隐效应D值,t检验显示高坚毅组(0.55± 0.36)显著低于低坚毅组(0.87± 0.49),t=-2.257,P<0.05,Cohen'd=0.74.两组被试均诱发明显的N400和LPP,高坚毅组中N400在任务状态下主效应显著,F(1,17)=8.528,P<0.05,η2=0.334,且在电极位置上主效应显著,F(10,170)=8.207,P<0.001, η2=0.326.LPP在任务状态下主效应显著,F(1,17)=5.471,P<0.05,η2=0.243,且在电极位置上主效应显著,F (10,170)=18.479,P<0.001,η2=0.521;低坚毅组中N400在任务状态下主效应显著,F(1,17)=10.051,P<0.05,η2=0.372,且在电极位置上主效应显著,F(10,170)=8.223,P<0.001,η2=0.326,LPP在任务状态下主效应不显著.结论:1.军医大学学员坚毅性评价的内隐效应显著,即均倾向于认为自我的坚毅性高,他人的坚毅性低,通过问卷法评估坚毅性时应考虑坚毅评价的内隐效应.2.高、低坚毅性军医大学学员坚毅性内隐评价时的主要脑电成分N400、LPP存在差异,N400可作为坚毅性内隐评价符合程度的判断指标.3.内隐效应及N400可以作为对军医大学学员坚毅性评价时的客观指标.
...不再出现此类内容
编辑人员丨2023/8/5
