QuantumBench: 量子问题求解基准测试
目前,大型语言模型已融入众多科研工作流程,显著提升了数据分析、假说生成与设计空间探索的效率。随着应用的扩展,研究人员亟需严谨评估这些模型是否准确掌握专业领域的知识与符号体系,因为通用评估基准往往无法满足这类需求。这一短板在量子科学领域尤为突出——该学科既包含反直觉现象,又依赖高阶数学工具。本研究推出首个量子领域专用评估基准QuantumBench,系统考察大模型对这一反直觉学科的理解与应用能力。借助公开资料,该团队编制了约800道涵盖量子科学九大分支的题目及参考答案,并将其组织为八选项多选题数据集。基于此基准,研究人员对现有多个大模型进行评测,分析其在量子领域的表现(包括对题型变化的敏感性)。作为量子学科首个大模型评估数据集,QuantumBench旨在为量子研究中大模型的有效运用提供指引。
量科快讯
【悉尼大学科学家首次对真实分子的化学动力学进行了量子模拟】悉尼大学的研究人员最近首次对真实分子的化学动力学进行了量子模拟,相关成果已于日前发表在《美国化学会志》上。该研究通过模拟分子受光激发后的行为…
43 分钟前
【瑞典六所高校联合成立量子技术中心,将打造国家级研究枢纽】瑞典六所高校近日联合签署谅解备忘录,共同成立瑞典量子技术中心,以打造一个集研究、创新、教育与能力建设于一体的国家级量子技术枢纽。参与高校包括…
14 小时前
2 天前
【科学家找到能帮助量子传感器消除噪声影响的新型量子纠缠态】科罗拉多大学博尔德分校的物理学家与JILA研究人员及尼尔斯·玻尔研究所、联合量子研究所、印度理工学院马德拉斯分校的合作者近日在《物理评论X》…
2 天前
3 天前

