字节跳动开源 Protenix-v2:生物分子结构预测再升级

分类: 生物模型 |发布于: 4/9/2026 |最后更新: 4/9/2026
字节跳动开源 Protenix-v2:生物分子结构预测再升级

字节跳动开源 Protenix-v2:生物分子结构预测再升级

基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。

如果你关注过蛋白质结构预测领域,大概率知道 AlphaFold——这个用 AI 预测蛋白质三维结构的模型,让结构生物学研究效率提升了一个数量级。现在,字节跳动开源了自己的生物分子结构预测模型 Protenix,并在 4 月 8 日发布了新版本 Protenix-v2。

Protenix 是什么?

Protenix 是字节跳动推出的高精度生物分子结构预测模型,目标是提供开源、可自部署的蛋白质及复合物结构预测工具。

它的能力包括:

  • 蛋白质单体折叠预测:给定氨基酸序列,预测三维结构
  • 蛋白质-配体复合物预测:预测小分子药物与蛋白质的结合模式
  • 蛋白质-核酸复合物预测:预测蛋白质与 DNA/RNA 的相互作用
  • 抗原-抗体复合物预测:预测抗体与抗原的结合结构

从技术参数看,Protenix 的基础模型参数量约 368M,与 AlphaFold 3 接近,训练数据截止时间也与其对齐(2021-09-30)。

v2 版本有什么新改进?

Protenix-v2 在 4 月 8 日正式发布,主要改进包括:

参数量提升:从基础版的 368M 提升到约 464M,模型容量更大。

抗原-抗体预测增强:这是 v2 的重点改进方向。抗原-抗体结构预测对药物发现和免疫学研究至关重要——抗体药物的靶点确认、先导化合物优化都依赖于此。v2 在这方面的精度有明显提升。

配体合理性判断优化:在预测蛋白质-配体复合物时,模型会判断配体的"合理性",减少不合理的预测结果。

训练动态改进:训练策略和优化方式有调整,整体预测稳定性更好。

生态配套:不只是预测模型

Protenix 不是一个孤立的模型,字节跳动围绕它构建了一套生态工具:

PXDesign:基于 Protenix 基础模型的蛋白质结合物设计工具。实验成功率 20-73%,比之前的最佳方法(AlphaProteo、RFdiffusion)高 2-6 倍。这对蛋白质设计领域是个有价值的进展。

PXMeter:开源的结构预测模型评测工具包,包含高质量基准数据集,方便研究人员对比不同模型的性能。

Protenix-Dock:蛋白质-配体对接框架,使用经典打分函数(不依赖深度神经网络),在刚性对接任务上表现不错。

对谁有用?

药物研发人员:抗原-抗体预测、蛋白质-配体对接是抗体药物和小分子药物研发的关键步骤。开源模型意味着可以在本地部署,数据不用上传到第三方服务器。

结构生物学家:实验手段(X 射线晶体学、冷冻电镜)成本高、周期长,AI 预测可以作为补充,帮助筛选实验目标。

学术研究者:开源代码、开源模型、完整训练流程,可以在自己的数据上微调或扩展。

怎么用?

安装很简单:

```bash

pip install protenix

```

预测结构:

```bash

protenix pred -i examples/input.json -o ./output -n protenix-v2

```

GitHub 仓库:https://github.com/bytedance/Protenix

模型有多个版本可选,最新的是 protenix-v2(2026-04-08 发布)。

总结

Protenix-v2 的发布,意味着国内在大分子结构预测领域有了开源、可自部署的高精度模型。对生物医药行业来说,这是个值得关注的进展——不只是因为技术能力,更因为它提供了"数据不出境"的选择。

模型本身的开源、生态工具的配套,让它不只是"又一个 AlphaFold 追随者",而是一个有独立价值的工具链。如果你在做药物发现、结构生物学或相关研究,值得花时间了解。

---

参考来源

  • Protenix GitHub 官方仓库:https://github.com/bytedance/Protenix
  • Protenix-v2 技术报告:https://github.com/bytedance/Protenix/blob/main/docs/PX2.pdf

参考来源

说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。