背景:2026年5月12日,在杭州举行的2026世界数字教育大会上,发布了6项科学智能相关成果。以下针对其中三项更具代表性的技术方向进行客观梳理。
一、Carbon:生成式基因组大模型
发布方:北京中关村学院、HuggingFace
核心定位:不依赖传统序列比对的基因组理解与设计模型 传统基因组注释高度依赖与已知序列的相似性比对。Carbon尝试绕过这一路径,通过学习DNA序列的统计规律与潜在“语法”,实现: 该模型计划于2026年5月底开源。其实验结果目前以预印本形式公开,尚未经正式同行评审,更大范围的泛化能力仍需验证。 二、DeepRare:可溯源罕见病诊断系统
发布方:上海交通大学
发表情况:Nature
应用规模:全球600余家机构(大会数据为1300+,详见来源) 罕见病诊断的核心难点之一在于AI输出的不可解释性。DeepRare采用“中枢-分身”可溯源架构(Agentic AI),具备以下技术特征: 测试结果(公开数据): 该系统的价值在于推动了AI在诊断决策过程中的可验证性与可用性,而非仅追求准确率。 三、DeepScientist:自动化科研发现系统
发布方:西湖大学
开源状态:已开源
注册用户:7500+(来自高校及研究机构) DeepScientist被定义为具备完整科研能力的AI系统,可在无人干预下完成: 公开的实验数据: 在AI文本检测任务中,2周完成相当于人类研究者3年的进展 在RAID数据集上:AUROC提升7.9%,推理延迟降低190% 在智能体失败归因任务中:性能较人类专家最优方案提升183.7%
发现规律:研究团队称存在“科学发现缩放定律”,即在1→16个GPU扩展下,每周前沿级发现数量从0增至11。该结论目前来自单一机构的实验设置,尚需更多独立复现。 DeepScientist的目标是构建“人机协同的科研范式”,不宣称取代人类研究者,而是减少试错成本、加速探索周期。 四、其他3项成果(简要)
大会同期还发布了以下三项成果: 面向自驱动实验室的智能体基础设施(上海创智学院、华东师范大学) 无线世界高精度多模态实测数据集 & AI4Net基础模型(深圳河套学院、深圳市大数据研究院) 中医药学科教育大模型“薪火中国药”(北京中医药大学)
五、如何理解“范式变化”
从上述成果中可以归纳出几点较明确的趋势信号: 从“辅助工具”到“科研执行体”:AI不再只做分类或预测,而是承担设计、实验、归因、论文撰写等完整环节 解释性与可信度被纳入核心指标(尤其DeepRare) 开源与可复现成为科研AI系统的默认要求(Carbon、DeepScientist) 算力从“训练垄断”走向“发现加速”(DeepScientist的并行扩展效应)
也需注意: 参考内容来源
一、会议基本信息
二、6项科学智能成果发布(核心来源)
三、Carbon
四、DeepRare
五、DeepScientist
|