tool-banner
工具目录
Protenix
Protenix
抗体结构预测
2025-12-12
立即尝试

Protenix

1. 简介

Protenix1是字节跳动推出的开源模型,基于pytorch复现AlphaFold3模型,功能聚焦于生物分子结构预测,特色体现在性能、方法、数据和开源等多个方面:

  • 功能:能够精准预测蛋白质-配体、蛋白质-核酸等多种生物分子的三维结构,还可用于解析复杂的抗体-抗原相互作用结构,为生物和药理研究提供关键的结构信息支撑。
  • 性能卓越:在PoseBusters V2等多个基准测试中,针对不同分子类型的结构预测表现优异,超越AF32、AF2.3和RF2NA等模型,处于行业前沿水平。
  • 方法优化:依据AF3描述进行复现,修正模糊步骤与错误,调整置信头架构,提升预测准确性。
  • 数据丰富:训练数据涵盖PDB实验结构、AlphaFold2和OpenFold3预测的蛋白质单体结构;提供经大量计算处理的MSA搜索结果及PDB ID与处理数据的映射,方便研究人员使用。
  • 完全开源:公开模型权重、推理和训练代码,配备详尽文档,方便研究人员深入研究、复现结果并拓展应用。

目前AbSeek部署的Protenix版本为v0.5.0,性能表现如下图

图 1. Protenix的性能表现

图 2. Protenix添加约束条件后的性能表现

2.参数说明

本工具支持处理多种分子类型,包括蛋白质、DNA、RNA 和小分子。可通过参数 Molecule Type 进行选择。目前仅支持标准氨基酸、标准碱基,以及 SMILES 格式的小分子输入。

点击 Add Sequence 按钮可添加新序列。系统将根据添加顺序,自动以大写字母 A–Z 为链进行编号。

点击 Add Constraints 按钮可添加多种约束类型,包括:

  • 残基/原子间距离约束(contact)
  • 口袋距离约束(pocket)

请注意,约束设置并非强制性,最终结构以预测输出结果为准。

如需了解更多约束设置的详细说明,请参阅官方文档:https://github.com/bytedance/Protenix/blob/main/docs/infer_json_format.md

3.结果说明

将返回5个预测结构的.cif文件,以及每个结构对应的预测指标.csv文件,以下是核心指标的解释:

指标 英文全称 中文全称 数值范围 关注层级 典型阈值/解读 主要用途
ranking score ranking score 排序分析 0-1 整体复合物 排名的预测置信度 评估整体置信度
pLDDT predicted Local Distance Difference Test 预测的局部距离差异测试分数 0–100 残基/原子 ≥ 90 极高置信;< 50 低置信 定位无序区、局部分辨率
pTM predicted Template Modeling score 预测的模板建模得分 0–1 单链/整体复合物 ≥ 0.5 折叠基本正确 全局拓扑可靠性
ipTM interface predicted TM-score 界面预测TM分数 0–1 链间界面 ≥ 0.8 高质量对接 复合物链间相互作用
PDE Predicted Distance Error 预测距离误差 ≥ 0 (Å) 残基对 越低越好 局域距离误差预测
GPDE Global Predicted Distance Error 全局预测距离误差 ≥ 0 (Å) 全链/全复合物 越低越好 整体误差宏观比较

4. 参考文献

[1] ByteDance AML AI4Science Team. Protenix - Advancing Structure Prediction Through a Comprehensive AlphaFold3 Reproduction. bioRxiv 2025.01.08.631967. https://doi.org/10.1101/2025.01.08.631967

[2] Abramson, Josh, Jonas Adler, Jack Dunger, Richard Evans, Tim Green, Alexander Pritzel, Olaf Ronneberger, Lindsay Willmore, Andrew J Ballard, Joshua Bambrick, et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, 2024, 630(8016):493-500. https://doi.org/10.1038/s41586-024-07148-1

[3] Ahdritz, Gustaf, Nazim Bouatta, Christina Floristean, Sachin Kadyan, Qinghui Xia, William Gerecke, Timothy J O’Donnell, Daniel Berenberg, Ian Fisk, Niccolò Zanichelli, et al. OpenFold: Retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization. Nature Methods, 2024, 21(8):1514-1524. https://doi.org/10.1038/s41592-024-02219-9

[4] Mirdita, Milot, Konstantin Schütze, Yoshitaka Moriwaki, Lim Heo, Sergey Ovchinnikov, and Martin Steinegger. ColabFold: making protein folding accessible to all. Nature methods, 2022, 19(6):679-682. https://doi.org/10.1038/s41592-022-01488-1

0