好奇胜过炒作:通过动机语言建模解析量子技术精英培养项目的早期成效

该研究团队通过分析241份西班牙语入学申请的开放式回答,探究其中潜在的动机信号是否能预测学生在秘鲁QuantumHub量子计算早期培养路径中的参与度和表现。研究聚焦两个选拔性课程模块:模块1(中学阶段;数学与计算基础;n=23)和模块2(中学至大学初级阶段;量子基础;n=36,含模块1继续学习者)。为确保基准可比性,模块2的入学考试难度与模块1期末考试匹配,最终成绩采用项目官方制定的队列特定权重(出勤/作业/考试)进行计算以保持生态效度。 方法上,研究人员采用潜在狄利克雷分配模型(LDA,k=8)进行文本建模,并辅以小型多语言模型EmbeddingGemma-300M生成的句子嵌入增强稳健性——通过UMAP降维后采用HDBSCAN聚类。这种组合方法既利用了词袋主题的透明度,又结合了小语言模型嵌入的语义丰富性。描述性分析显示,“好奇心/学习”类主题比“技术/职业导向”类主题具有更高的成绩和出勤率;但推断性检验效力不足(线性R²≈0.03;逻辑伪R²≈0.04),故效应量估计应视为初步探索而非确证结论。基于嵌入的聚类产生7个类别(噪声占比11.2%),与LDA结果一致性一般(ARI=0.068;NMI=0.163)。 研究结果表明,简短的动机陈述蕴含具有预测价值的信号,可为严格STEM培养通道的早期导师指导提供参考,同时凸显了开展更大规模预注册研究的必要性。

作者单位: VIP可见
期刊参考: 登录可见
页数/图表: 登录可见
提交arXiv: 2026-02-23 10:09

量科快讯