迈向多智能体科学人工智能系统的评估框架 | 量子科技中心_量科网

迈向多智能体科学人工智能系统的评估框架

ArXiv预印本仅供参考 2026-04-01 11:58

参考来源 ➔ 下载PDF ➔

该研究团队分析了评估科学（多）智能体系统时面临的挑战，包括难以区分推理与检索过程、数据/模型污染风险、针对新研究问题缺乏可靠基准答案、工具使用带来的复杂性，以及知识库持续更新导致的复现难题。团队探讨了构建抗污染问题的方法、生成可扩展任务系列的策略，以及通过更贴近真实科研实践的多轮交互来评估系统的必要性。作为可行性验证，该工作展示了如何构建新型研究构想数据集以测试系统的样本外表现。此外，团队还讨论了与量子科学领域研究者及工程师的访谈结果，通过分析科研人员对AI系统的交互预期，探讨这些预期应如何影响评估方法的构建。

作者单位： VIP可见

页数/图表： 登录可见

提交arXiv： 2026-03-18 16:05

量科快讯

【牛津物理学家的创新方法能将杂质自旋做为量子自旋液体的“见证者”】牛津大学的物理学家提出一种探寻量子自旋液体的新方法。该研究团队以矿石Herbertsmithite为研究对象，首次将杂质自旋重新概念化为量子…

2 天前

【跨大西洋新纪录！Colt与Ciena完成最快800GbE量子安全数据传输试验】Colt Technology Services近日与Ciena合作完成了一次跨大西洋量子安全数据传输的里程碑式试验，这也是跨大西洋线路上迄…

2 天前

【JIJ联合ORCA等发布白皮书：混合量子-经典优化在能源行业正迈向商业应用】日本JIJ公司与英国ORCA Computing公司近日联合英国石油公司bp及英国国家量子计算中心（NQCC）发布一份白皮书，证明混合量子-…

2 天前

【新综述揭示光子空间纠缠有望成为量子技术的关键资源】德国达姆施塔特工业大学的一个研究团队近日在《激光与光子学评论》期刊上发表了一篇关于“位置-动量纠缠”的综述论文，系统总结了该领域的研究现状并…

2 天前

【光量子计算公司Xanadu在超低损耗光子芯片封装方面取得突破】加拿大光量子计算公司Xanadu近日宣布在超低损耗光子芯片封装领域取得一项新成就，它已成功实现平均每面0.085dB的边缘耦合损耗，这是衡量…

2 天前

【Nu Quantum在分布式量子计算方面取得新突破，单QPU失效已不再致命】Nu Quantum近日公布一项最新研究成果，展示了多节点量子网络在设计上可以容忍单个量子处理单元（QPU）完全出现故障。模拟结果表明，在信…

2 天前

【PINQ²与Numana达成战略合作，将推动量子计算与量子通信融合发展】加拿大数字和量子创新平台PINQ²与Numana近日宣布达成战略合作，将把双方在量子计算与安全量子通信领域的互补专长相结合。根据协议，PIN…

2 天前

【科学家找到能帮助量子传感器消除噪声影响的新型量子纠缠态】科罗拉多大学博尔德分校的物理学家与JILA研究人员及尼尔斯·玻尔研究所、联合量子研究所、印度理工学院马德拉斯分校的合作者近日在《物理评论X》…

2 天前

【印度科学家发现利用表面声波调控磁振子的新机制，有望降低量子计算能效】印度科技部下属机构纳米科技研究所的研究人员发现一种新机制，可利用表面声波生成并控制基于磁振子的自旋流（即自旋波激发），有望降低下一代计算技术…

2 天前

【华盛顿大学科学家正利用AI与量子计算加速量子材料发现】美国华盛顿大学近日在两项研究中展示了新兴计算技术如何加速发现具有潜力的量子材料。首项研究发表在《美国国家科学院院刊》，团队利用人工智能模拟了…

3 天前

【IQM发布“杠铃码”：逻辑错误率降低三个数量级，物理比特需求骤降八倍】IQM量子计算机公司近日宣布开发出一种新型量子纠错码“barbell codes（杠铃码）”，可将逻辑错误率比表面码降低三个数量级，同时所需…

3 天前

【新加坡国立大学开发出目前具有最高安全等级的量子随机数生成器芯片】新加坡国立大学的一个研究团队开发出一种具备自检功能的量子随机数生成器（QRNG）芯片。该芯片在QRNG芯片中实现了迄今为止最高的安全等级，其…

3 天前

【日本研究团队首创性地开发出量子多编程自动模式，可大幅提升系统吞吐量】日本大阪大学量子信息与量子生物学中心（QIQB）联合系统工程顾问公司及顺天堂大学的研究人员，近日在其量子计算云服务中，上线了全球首个量子多编…

3 天前

【科学家发布量子临界传感技术实用指南，助力量子增强传感步入实用阶段】都柏林大学学院的研究人员与国际合作者近日发布了一份详细且易懂的指南，旨在将一种理论构想转化为实用的量子增强传感设备。量子器件往往十分脆弱，一…

3 天前

【Quantum X Labs与Quantum Machines旗下公司将合作评估其AI量子纠错技术】量子技术公司Quantum X Labs与Quantum Machines旗下IQCC近日签署战略合作协议，Quantum X Labs将在…

3 天前

【以色列创新署资助QTREX百万美元，以开发超导量子计算专用介电材料】QTREX Quantum Ltd.近日宣布，它已获得以色列创新署约100万美元资助，用于开发一种专为可扩展超导量子计算系统设计的介电材料，…

3 天前

【美国陆军在量子传感器领域取得重要突破，首次实现测量射频电磁场完整三维方向】美国陆军作战能力发展司令部下属的陆军研究实验室在量子传感领域实现重大突破，首次演示了一种能够测量射频电磁场完整三维方向的量子传感器。该传感器…

3 天前

【国际科研团队在一种半导体材料中观测到激子与声子的相干“量子舞蹈”】一个国际研究团队最近观测到了半导体材料中激子与声子共同演化而形成的完全相干量子舞蹈。通常情况下，晶格振动会迅速破坏脆弱的量子态，但研究者在卤…

3 天前

【Quantropi与诺基亚联手推出量子安全密钥分发一体化方案，已完成真实环境测试】量子安全技术公司Quantropi近日宣布，与诺基亚联合推出一款可实现规模化量子安全密钥分发的一体化解决方案。该方案将Quantropi的数…

3 天前

【科学家开发的新型二维金属有机框架能解决堆叠二维材料导致的性能下降瓶颈】韩国科学技术院（KAIST）的研究团队成功开发出一种新的二维导电金属有机框架（MOF），其即使在多层堆叠状态下也能保持单层电子特性。该研究…

4 天前

【南洋理工大学科学家开发出新型量子点技术，能在极低浓度下保持高亮度】新加坡南洋理工大学的科学家开发出一种新型钙钛矿纳米晶体（即量子点），其在水环境中仍能保持高亮度和稳定性。该团队创新性地将原本用于保护纳米晶体…

4 天前

【台湾大学研究人员展示通过界面工程实现无电压调控两种材料间的电子空间排布】近日，台湾大学的研究人员在《自然·通讯》发表了一项新研究，展示了如何通过界面工程，在半金属铋（Bi）薄膜与二维半导体二硫化钼（MoS₂）之间…

4 天前

【港大团队开发出极低温神经形态硬件，有望为量子计算规模扩展提供新路径】香港大学工程学院电机与计算机工程系与先进半导体与积体电路研究中心（CASIC）的研究人员，近日在低温电子学领域取得重大突破。他们开发出一款可…

4 天前

【韩国SK电讯获欧盟资助，将联手欧洲三国机构研发下一代量子密码技术】韩国SK电讯（SK Telecom）近日宣布，其已获得欧盟大型研究资助项目“地平线欧洲”计划下的一个项目，旨在开发下一代量子密码技术。该项目…

4 天前

【悉尼大学量子技术团队成立名为Emergence Quantum的研究型公司】澳大利亚悉尼大学量子技术团队近日正式成立了一家名为Emergence Quantum的量子研究公司。这家由David Reilly教授和Th…

4 天前

【英国斥资2000万英镑资助量子优势加速器项目以加速量子软件研发进程】英国政府最近投入2000万英镑资助了爱丁堡大学量子软件实验室（QSL），以加速量子软件的研发进程。该资金还将支持医疗健康、能源、金融及网络安…

4 天前

【量子计算先驱Diraq任命CMOS技术领域知名人士为新任董事会主席】量子计算先驱Diraq近日宣布任命Scott A. McGregor为新任董事会主席。Diraq表示，McGregor曾主导微软Window…

4 天前

【美日斥资10亿美元达成规模最大科研合作之一，聚焦量子科技等六大领域】美国能源部（DOE）与日本文部科学省、日本经济产业省近日宣布建立一项价值10亿美元（未来五年内各投入5亿美元）的战略合作伙伴关系，使日本成为…

4 天前

【科学家在菱面体石墨烯中发现异常超导态，有望推动量子技术发展】有佛罗里达州立大学物理学家参与的一项国际合作研究发现，菱面体石墨烯中会出现异常的超导态，有望驱动意想不到的量子技术的发展。相关研究已于日前发…

4 天前

【芬兰量子计算机公司IQM提供的F-4注册声明已获SEC批准生效】近日，芬兰全栈超导量子计算机开发商IQM Quantum Computers与特殊目的收购公司Real Asset Acquisition（…

4 天前