OpenAI 推出 GPT-Rosalind：AI 能帮科学家做研究了

GPT-Rosalind：AI 能帮科学家做研究了

基于已整理草稿生成的网页版文章，适合先稳定落地，再做局部润色与发布检查。

如果你从事生命科学研究，这条消息值得关注：OpenAI 在 4 月 16 日推出了专为生物学、药物发现和转化医学设计的 GPT-Rosalind 模型。它不只是"会回答问题的 AI"，而是能理解分子结构、蛋白质工程、基因组学等专业领域，还能调用 50 多个科研数据库和工具。这意味着科学家可以用它加速文献综述、设计实验、分析数据，把更多时间花在真正需要创造力的工作上。

这是什么？

GPT-Rosalind 是 OpenAI 生命科学模型系列的首发版本，专门为科研工作流优化。它的名字来自 Rosalind Franklin——那位通过 X 射线晶体学揭示 DNA 结构的科学家。

与通用模型不同，GPT-Rosalind 在以下领域有深度优化：

化学与分子生物学：理解化学反应机制、分子结构
蛋白质工程：预测蛋白质结构、突变影响和相互作用
基因组学：解读 DNA 序列、系统发育分析
实验设计：帮助规划实验步骤、选择合适方法

目前，这个模型通过 ChatGPT、Codex 和 API 提供给符合条件的用户使用。

能做什么？

GPT-Rosalind 的核心能力是支持科研工作流中的多个环节：

文献综述

科研人员每天要阅读大量论文，但时间和精力有限。GPT-Rosalind 可以快速扫描文献，提取关键发现、方法对比、数据矛盾，帮你判断哪些论文值得细读。

实验设计

设计一个实验要考虑很多因素：对照组怎么设、用什么方法、预期结果是什么。模型可以基于已有研究，帮你规划实验步骤，指出潜在问题。

数据分析

实验数据出来了，但要解读它们并不容易。模型可以帮你识别数据中的规律，提出可能的解释，甚至建议下一步验证实验。

工具调用

这是 GPT-Rosalind 的一个亮点：它不只是"懂"科研，还能"用"科研工具。通过 Life Sciences 插件，它可以连接 50 多个公开数据库：

PubMed（文献检索）
UniProt（蛋白质序列）
PDB（蛋白质结构）
NCBI 基因数据库
临床试验数据库

你不需要手动去每个网站查询，模型可以帮你完成这些操作。

表现如何？

OpenAI 公布了几个基准测试结果：

BixBench

这是一个针对生物信息学和数据分析的基准测试。GPT-Rosalind 在已公开成绩的模型中排名第一。

LABBench2

这个基准测试包含 11 项科研任务，涵盖文献检索、数据库访问、序列操作、实验方案设计等。GPT-Rosalind 在 6 项任务上超越了 GPT-5.4，最显著的是克隆实验设计（CloningQA）任务——需要端到端设计 DNA 和酶试剂。

真实场景测试

OpenAI 与基因治疗公司 Dyno Therapeutics 合作，测试了 RNA 序列预测和生成任务。结果：模型的预测任务排名超过 95% 的人类专家，生成任务排名约 84%。这说明在特定任务上，AI 已经可以达到甚至超过人类专家水平。

怎么用？

目前有几种方式：

ChatGPT

研究预览版已经开放，但需要是符合条件的用户（主要是企业用户）。

Codex

OpenAI 发布了免费的 Life Sciences 插件，可以从 GitHub 下载。这个插件包含常见科研工作流的模块化技能，如蛋白质结构查询、序列搜索、文献综述等。所有用户都可以用这个插件配合通用模型，但企业用户可以配合 GPT-Rosalind 获得更强的生物推理能力。

API

通过信任访问计划申请。OpenAI 要求申请机构满足三个条件：

进行有公共利益的合法科研
有适当的治理、合规和滥用预防措施
在安全的环境中限制只有获批用户可以使用

有什么限制？

目前这个模型有几个限制需要注意：

地区限制：仅向美国合格企业用户开放首发
访问控制：需要申请并通过安全审查
定价未定：研究预览期免费，但后续定价尚未公布
数据不共享：OpenAI 表示研究预览期使用不消耗现有额度，但有滥用防护机制

另外，模型的名字虽然来自 Rosalind Franklin，但她家族是否知情或同意，OpenAI 未在公告中提及。

对谁有用？

制药企业

药物发现最耗时的阶段是靶点筛选和假设验证。GPT-Rosalind 可以加速这个过程——快速分析文献、提出候选靶点、设计验证实验。Amgen、Moderna 等公司已经在测试。

生物技术公司

需要频繁设计实验、分析数据的团队，可以用它作为"研究助手"，减少重复劳动。

学术研究机构

虽然首发主要面向企业，但学术机构未来可能也会获得访问机会。对于需要处理大量文献的研究者来说，这是一个潜在效率工具。

基因治疗和 RNA 研究公司

Dyno Therapeutics 的测试结果显示，模型在 RNA 序列预测和设计任务上表现出色。这类公司可能会率先受益。

总结

GPT-Rosalind 是 OpenAI 向垂直领域深耕的又一次尝试。此前，通用大模型在专业领域的表现往往不尽如人意——它们"知道"很多概念，但在具体任务上容易出错。GPT-Rosalind 的思路是：不只是训练一个更强的模型，而是让它学会使用专业工具、遵循科研工作流。

对科研工作者来说，多了一个能理解专业术语、调用专业数据库的"研究助手"，确实有潜在价值。但它的实际效果，还需要在真实的科研场景中验证——能不能真正加速发现，而不是只是"看起来很厉害"。

---

*信息来源：OpenAI 官方博客（2026-04-16）*

参考来源

https://openai.com/index/introducing-gpt-rosalind/

说明：该页面由基础模板稳定生成，后续可继续局部润色样式或补充模块，再进入发布检查。