Hygieia：多模态AI Agent诊断罕见病，临床验证超越医生12-60%，还能排序风险基因

分类: 生物模型 |发布于: 5/8/2026 |最后更新: 5/8/2026

基于已整理草稿生成的网页版文章，适合先稳定落地，再做局部润色与发布检查。

5月7日，耶鲁大学、杜克-NUS医学院和斯坦福大学联合团队在arXiv发表Hygieia，一个面向罕见病诊断的多模态AI Agent系统。它整合患者的表型特征、基因组数据和临床记录，通过路由器分派不同诊断策略，并利用知识增强框架减少幻觉。在多个诊断基准上，Hygieia达到了当前最优水平；与Yale和Duke-NUS临床专家的真实协作验证中，它比医生的诊断准确率高出12%到60%，同时还能为罕见病优先排序基因组风险因子并提供置信度评分。

罕见病诊断为什么难

罕见病指影响人群比例低于1/2000的疾病，全球受影响患者超过3亿。传统诊断流程平均需要4到5年，被称为"诊断奥德赛"——患者反复就诊、反复检查，却很难得到准确结论。原因很简单：罕见病表型容易跟常见病混淆，单一数据源（比如只看症状或只看基因）往往不够。Hygieia的核心思路就是让AI同时看"患者的症状长什么样""基因组里有什么线索""病历里写了什么"，再综合判断。

Hygieia怎么做

Hygieia的设计有几个关键特点：

路由器机制：不同类型的疾病需要不同诊断策略。Hygieia内置路由器，根据疾病类别自动选择最合适的诊断路径，而不是用一套流程硬套所有情况。

知识增强框架：通用大模型容易"编造"医学信息。Hygieia通过知识增强减少幻觉，让诊断结论有据可查。

风险基因排序：这是Hygieia区别于通用医学AI的关键能力。它不只是给出一个诊断名称，还能从基因组数据中优先排序与该罕见病相关的风险基因，帮助医生快速锁定遗传学线索。

置信度评分：每次诊断都给出可信程度评估，让临床医生知道什么时候可以信赖AI的判断，什么时候需要二次确认。

临床验证：超越医生不是空话

团队与耶鲁医学院和杜克-NUS的临床专家合作进行了两轮验证：

诊断对比：Hygieia在多个诊断基准上的准确率比临床医生高出12%到60%，提升幅度因疾病类别而异。
辅助真实病例：在处理真实世界病例时，Hygieia有效帮助临床医生减少工作量——医生借助AI可以更快做出更准确的判断。

这并不是说AI要取代医生，而是证明在罕见病这个信息高度不对称的领域，AI可以作为强有力的辅助工具。

局限

研究系统：Hygieia目前是学术研究系统，尚未进入FDA等监管审批流程，离临床部署还有距离。
数据获取门槛：多模态输入（表型+基因组+临床记录）在现实中并不总是能同时获得，特别是基因组数据在很多医院还非常规检测。
验证规模：目前的临床协作验证规模有限，更广泛的真实世界验证还在进行中。

同期工作

同一时间段，Ingenix团队在arXiv发表了BioResearcher，一个面向转化医学的场景引导多Agent系统。它覆盖文献检索、临床试验分析、专利查询和多组学定量分析，在BixBench基准上达到89.33%。两者方向不同——Hygieia专注诊断，BioResearcher专注研究流程自动化——但都体现了AI Agent在生物医学领域从"单点工具"向"全流程助手"演进的趋势。

---

*基于 arXiv 论文（arXiv:2605.06226，2026年5月7日提交）整理。*

参考来源

https://arxiv.org/abs/2605.06226

说明：该页面由基础模板稳定生成，后续可继续局部润色样式或补充模块，再进入发布检查。