Hygieia:多模态AI Agent诊断罕见病,临床验证超越医生12-60%,还能排序风险基因
Hygieia:多模态AI Agent诊断罕见病,临床验证超越医生12-60%,还能排序风险基因
基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。
5月7日,耶鲁大学、杜克-NUS医学院和斯坦福大学联合团队在arXiv发表Hygieia,一个面向罕见病诊断的多模态AI Agent系统。它整合患者的表型特征、基因组数据和临床记录,通过路由器分派不同诊断策略,并利用知识增强框架减少幻觉。在多个诊断基准上,Hygieia达到了当前最优水平;与Yale和Duke-NUS临床专家的真实协作验证中,它比医生的诊断准确率高出12%到60%,同时还能为罕见病优先排序基因组风险因子并提供置信度评分。
罕见病诊断为什么难
罕见病指影响人群比例低于1/2000的疾病,全球受影响患者超过3亿。传统诊断流程平均需要4到5年,被称为"诊断奥德赛"——患者反复就诊、反复检查,却很难得到准确结论。原因很简单:罕见病表型容易跟常见病混淆,单一数据源(比如只看症状或只看基因)往往不够。Hygieia的核心思路就是让AI同时看"患者的症状长什么样""基因组里有什么线索""病历里写了什么",再综合判断。
Hygieia怎么做
Hygieia的设计有几个关键特点:
路由器机制:不同类型的疾病需要不同诊断策略。Hygieia内置路由器,根据疾病类别自动选择最合适的诊断路径,而不是用一套流程硬套所有情况。
知识增强框架:通用大模型容易"编造"医学信息。Hygieia通过知识增强减少幻觉,让诊断结论有据可查。
风险基因排序:这是Hygieia区别于通用医学AI的关键能力。它不只是给出一个诊断名称,还能从基因组数据中优先排序与该罕见病相关的风险基因,帮助医生快速锁定遗传学线索。
置信度评分:每次诊断都给出可信程度评估,让临床医生知道什么时候可以信赖AI的判断,什么时候需要二次确认。
临床验证:超越医生不是空话
团队与耶鲁医学院和杜克-NUS的临床专家合作进行了两轮验证:
- 诊断对比:Hygieia在多个诊断基准上的准确率比临床医生高出12%到60%,提升幅度因疾病类别而异。
- 辅助真实病例:在处理真实世界病例时,Hygieia有效帮助临床医生减少工作量——医生借助AI可以更快做出更准确的判断。
这并不是说AI要取代医生,而是证明在罕见病这个信息高度不对称的领域,AI可以作为强有力的辅助工具。
局限
- 研究系统:Hygieia目前是学术研究系统,尚未进入FDA等监管审批流程,离临床部署还有距离。
- 数据获取门槛:多模态输入(表型+基因组+临床记录)在现实中并不总是能同时获得,特别是基因组数据在很多医院还非常规检测。
- 验证规模:目前的临床协作验证规模有限,更广泛的真实世界验证还在进行中。
同期工作
同一时间段,Ingenix团队在arXiv发表了BioResearcher,一个面向转化医学的场景引导多Agent系统。它覆盖文献检索、临床试验分析、专利查询和多组学定量分析,在BixBench基准上达到89.33%。两者方向不同——Hygieia专注诊断,BioResearcher专注研究流程自动化——但都体现了AI Agent在生物医学领域从"单点工具"向"全流程助手"演进的趋势。
---
*基于 arXiv 论文(arXiv:2605.06226,2026年5月7日提交)整理。*
参考来源
说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。