字节跳动开源 Protenix-v2:生物分子结构预测再升级
字节跳动开源 Protenix-v2:生物分子结构预测再升级
基于已整理草稿生成的网页版文章,适合先稳定落地,再做局部润色与发布检查。
如果你关注过蛋白质结构预测领域,大概率知道 AlphaFold——这个用 AI 预测蛋白质三维结构的模型,让结构生物学研究效率提升了一个数量级。现在,字节跳动开源了自己的生物分子结构预测模型 Protenix,并在 4 月 8 日发布了新版本 Protenix-v2。
Protenix 是什么?
Protenix 是字节跳动推出的高精度生物分子结构预测模型,目标是提供开源、可自部署的蛋白质及复合物结构预测工具。
它的能力包括:
- 蛋白质单体折叠预测:给定氨基酸序列,预测三维结构
- 蛋白质-配体复合物预测:预测小分子药物与蛋白质的结合模式
- 蛋白质-核酸复合物预测:预测蛋白质与 DNA/RNA 的相互作用
- 抗原-抗体复合物预测:预测抗体与抗原的结合结构
从技术参数看,Protenix 的基础模型参数量约 368M,与 AlphaFold 3 接近,训练数据截止时间也与其对齐(2021-09-30)。
v2 版本有什么新改进?
Protenix-v2 在 4 月 8 日正式发布,主要改进包括:
参数量提升:从基础版的 368M 提升到约 464M,模型容量更大。
抗原-抗体预测增强:这是 v2 的重点改进方向。抗原-抗体结构预测对药物发现和免疫学研究至关重要——抗体药物的靶点确认、先导化合物优化都依赖于此。v2 在这方面的精度有明显提升。
配体合理性判断优化:在预测蛋白质-配体复合物时,模型会判断配体的"合理性",减少不合理的预测结果。
训练动态改进:训练策略和优化方式有调整,整体预测稳定性更好。
生态配套:不只是预测模型
Protenix 不是一个孤立的模型,字节跳动围绕它构建了一套生态工具:
PXDesign:基于 Protenix 基础模型的蛋白质结合物设计工具。实验成功率 20-73%,比之前的最佳方法(AlphaProteo、RFdiffusion)高 2-6 倍。这对蛋白质设计领域是个有价值的进展。
PXMeter:开源的结构预测模型评测工具包,包含高质量基准数据集,方便研究人员对比不同模型的性能。
Protenix-Dock:蛋白质-配体对接框架,使用经典打分函数(不依赖深度神经网络),在刚性对接任务上表现不错。
对谁有用?
药物研发人员:抗原-抗体预测、蛋白质-配体对接是抗体药物和小分子药物研发的关键步骤。开源模型意味着可以在本地部署,数据不用上传到第三方服务器。
结构生物学家:实验手段(X 射线晶体学、冷冻电镜)成本高、周期长,AI 预测可以作为补充,帮助筛选实验目标。
学术研究者:开源代码、开源模型、完整训练流程,可以在自己的数据上微调或扩展。
怎么用?
安装很简单:
```bash
pip install protenix
```
预测结构:
```bash
protenix pred -i examples/input.json -o ./output -n protenix-v2
```
GitHub 仓库:https://github.com/bytedance/Protenix
模型有多个版本可选,最新的是 protenix-v2(2026-04-08 发布)。
总结
Protenix-v2 的发布,意味着国内在大分子结构预测领域有了开源、可自部署的高精度模型。对生物医药行业来说,这是个值得关注的进展——不只是因为技术能力,更因为它提供了"数据不出境"的选择。
模型本身的开源、生态工具的配套,让它不只是"又一个 AlphaFold 追随者",而是一个有独立价值的工具链。如果你在做药物发现、结构生物学或相关研究,值得花时间了解。
---
参考来源:
- Protenix GitHub 官方仓库:https://github.com/bytedance/Protenix
- Protenix-v2 技术报告:https://github.com/bytedance/Protenix/blob/main/docs/PX2.pdf
参考来源
说明:该页面由基础模板稳定生成,后续可继续局部润色样式或补充模块,再进入发布检查。