

Protenix
1. 简介
Protenix1是字节跳动推出的开源模型,基于pytorch复现AlphaFold3模型,功能聚焦于生物分子结构预测,特色体现在性能、方法、数据和开源等多个方面:
- 功能:能够精准预测蛋白质-配体、蛋白质-核酸等多种生物分子的三维结构,还可用于解析复杂的抗体-抗原相互作用结构,为生物和药理研究提供关键的结构信息支撑。
- 性能卓越:在PoseBusters V2等多个基准测试中,针对不同分子类型的结构预测表现优异,超越AF32、AF2.3和RF2NA等模型,处于行业前沿水平。
- 方法优化:依据AF3描述进行复现,修正模糊步骤与错误,调整置信头架构,提升预测准确性。
- 数据丰富:训练数据涵盖PDB实验结构、AlphaFold2和OpenFold3预测的蛋白质单体结构;提供经大量计算处理的MSA搜索结果及PDB ID与处理数据的映射,方便研究人员使用。
- 完全开源:公开模型权重、推理和训练代码,配备详尽文档,方便研究人员深入研究、复现结果并拓展应用。
目前AbSeek部署的Protenix版本为v0.5.0,性能表现如下图

图 1. Protenix的性能表现

图 2. Protenix添加约束条件后的性能表现
2.参数说明
本工具支持处理多种分子类型,包括蛋白质、DNA、RNA 和小分子。可通过参数 Molecule Type 进行选择。目前仅支持标准氨基酸、标准碱基,以及 SMILES 格式的小分子输入。
点击 Add Sequence 按钮可添加新序列。系统将根据添加顺序,自动以大写字母 A–Z 为链进行编号。
点击 Add Constraints 按钮可添加多种约束类型,包括:
- 残基/原子间距离约束(contact)
- 口袋距离约束(pocket)
请注意,约束设置并非强制性,最终结构以预测输出结果为准。
如需了解更多约束设置的详细说明,请参阅官方文档:https://github.com/bytedance/Protenix/blob/main/docs/infer_json_format.md
3.结果说明
将返回5个预测结构的.cif文件,以及每个结构对应的预测指标.csv文件,以下是核心指标的解释:
| 指标 | 英文全称 | 中文全称 | 数值范围 | 关注层级 | 典型阈值/解读 | 主要用途 |
|---|---|---|---|---|---|---|
| ranking score | ranking score | 排序分析 | 0-1 | 整体复合物 | 排名的预测置信度 | 评估整体置信度 |
| pLDDT | predicted Local Distance Difference Test | 预测的局部距离差异测试分数 | 0–100 | 残基/原子 | ≥ 90 极高置信;< 50 低置信 | 定位无序区、局部分辨率 |
| pTM | predicted Template Modeling score | 预测的模板建模得分 | 0–1 | 单链/整体复合物 | ≥ 0.5 折叠基本正确 | 全局拓扑可靠性 |
| ipTM | interface predicted TM-score | 界面预测TM分数 | 0–1 | 链间界面 | ≥ 0.8 高质量对接 | 复合物链间相互作用 |
| PDE | Predicted Distance Error | 预测距离误差 | ≥ 0 (Å) | 残基对 | 越低越好 | 局域距离误差预测 |
| GPDE | Global Predicted Distance Error | 全局预测距离误差 | ≥ 0 (Å) | 全链/全复合物 | 越低越好 | 整体误差宏观比较 |
4. 参考文献
[1] ByteDance AML AI4Science Team. Protenix - Advancing Structure Prediction Through a Comprehensive AlphaFold3 Reproduction. bioRxiv 2025.01.08.631967. https://doi.org/10.1101/2025.01.08.631967
[2] Abramson, Josh, Jonas Adler, Jack Dunger, Richard Evans, Tim Green, Alexander Pritzel, Olaf Ronneberger, Lindsay Willmore, Andrew J Ballard, Joshua Bambrick, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, 2024, 630(8016):493-500. https://doi.org/10.1038/s41586-024-07148-1
[3] Ahdritz, Gustaf, Nazim Bouatta, Christina Floristean, Sachin Kadyan, Qinghui Xia, William Gerecke, Timothy J O’Donnell, Daniel Berenberg, Ian Fisk, Niccolò Zanichelli, et al. OpenFold: Retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization. Nature Methods, 2024, 21(8):1514-1524. https://doi.org/10.1038/s41592-024-02219-9
[4] Mirdita, Milot, Konstantin Schütze, Yoshitaka Moriwaki, Lim Heo, Sergey Ovchinnikov, and Martin Steinegger. ColabFold: making protein folding accessible to all. Nature methods, 2022, 19(6):679-682. https://doi.org/10.1038/s41592-022-01488-1

