Ingenix BioResearcher:专为转化医学打造的多Agent系统,30+工具协同,临床端到端基准测试领先
Ingenix BioResearcher:专为转化医学打造的多Agent系统,30+工具协同,临床端到端基准测试领先
基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。
5 月 7 日,生物AI公司 Ingenix 在 arXiv 发表了 BioResearcher——一个专为转化医学设计的场景引导多Agent系统。它用版本化的研究剧本替代开放式生成,让 30 多个专业工具和机器学习端点分工协作,在文献、临床试验、专利和多组学数据之间做可审计的证据整合,最后用声明级多模型对账确保输出可靠。
这是什么
转化医学的核心挑战是把模糊的研发目标变成可追溯的证据链——你要同时查文献、翻专利、调临床试验数据库、跑基因组分析,而且每一步都得保留溯源和不确定性标注。通用大模型和现有的多Agent系统并不擅长做这件事:它们倾向于给一个"最佳答案",或者漫无目的地跑下去,既不按场景走流程,也无法提供可审计的推理路径。
BioResearcher 的思路不同:它把每个查询映射到一套版本化的"研究剧本"(research playbook),再按剧本把任务分给专门的子Agent。这些子Agent各自调用不同的工具——文献检索、结构化数据库查询、沙箱代码执行基因组分析、机器学习端点预测——最后在输出前做一次声明级的多模型对账,逐条claim交叉验证后才进入编辑组装。
关键能力
场景引导而非开放式生成。 BioResearcher 不是把问题丢给一个通用Agent然后等它"自由发挥",而是根据查询类型匹配对应的研究剧本,按步骤走。这意味着同样的疾病机制查询,每次都会走相似的、可复现的分析路径。
30+ 工具和 ML 端点。 从文献检索到专利数据库,从结构化临床试验数据到沙箱内运行的基因组分析代码,BioResearcher 把转化医学常用的信息源和计算能力整合在一个系统里。
声明级对账。 不同模型和工具返回的结果可能互相矛盾。BioResearcher 在最终输出前,逐条声明做交叉验证和对账,不是简单拼凑,而是确保每条claim都有多源支撑。
性能表现
论文报告了三层评估结果:
- 单步能力测试(109 项):83.49% 通过率,0.892 平均分,领先基线。
- 生物医学推理基准:BixBench-Verified-50 上达到 89.33%;BaisBench Scientific Discovery 上获得 0.758 最高平均分。
- 临床端到端测试(30 项真实查询):阳性命中率 74.7%±3.3%,阴性清除率 96.8%±0.2%——意味着在应该找到靶点/药物的方向上命中率超七成,在应该排除的方向上几乎不会误报。
这些数字放在什么位置?BixBench 和 BaisBench 是目前生物AI领域较新的推理基准,专门考察模型在复杂生物问题上的推理深度,而非简单的知识问答。BioResearcher 在这两个基准上的表现都处于前列。
背后的公司
Ingenix 是一家定位"临床试验模拟基础模型"的生物AI公司,由 Applica 的联合创始人创立——Applica 是一家做多模态LLM的AI创业公司,2022年被 Snowflake 收购。Ingenix 的AI团队中包括 Applica TILT 的创建者和 LongLLaMA 的研究者。
公司官网显示,Ingenix 的核心产品是一个多模态、多尺度的生物基础模型,从分子层面到人群层面都能建模,目标是在药物进入临床试验之前就能模拟预测结果。BioResearcher 是这个平台在转化医学工作流上的一个具体应用层。
与现有方案的差异
目前生物医学AI领域有两类主流方案:一类是通用LLM加工具调用(如GPT系列+插件),另一类是专注于单一任务的专业模型。前者灵活但缺乏可审计性和场景一致性,后者精确但覆盖面窄。
BioResearcher 试图走第三条路:用多Agent架构覆盖广度,用场景剧本保证流程一致性,用声明级对账保证输出可靠性。它和前几天报道的 Hygieia(侧重罕见病诊断的多模态Agent)属于不同赛道——Hygieia 解决"诊断什么病",BioResearcher 解决"怎么把一个研发假设变成可追溯的证据链"。
限制
目前 BioResearcher 的信息来自 arXiv 预印本,尚未经过同行评审。论文中的端到端基准测试规模为 30 项查询,虽然结果亮眼,但覆盖范围有限。Ingenix 官网也未公布 BioResearcher 的开放API或定价信息,产品是否对外可用、以什么形式可用,还需要后续跟进。
基于 arXiv 预印本及 Ingenix 官网信息整理。
参考来源
- arXiv:2605.05985 — BioResearcher: Scenario-Guided Multi-Agent for Translational Medicine (2026-05-07)
- Ingenix 官网:https://ingenix.ai/
参考来源
说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。