
工具目录

蛋白逆折叠
抗体结构预测
2025-08-11
立即尝试
ProteinMPNN
1 引言
ProteinMPNN1 在计算机模拟和实验测试中表现出色。在原生蛋白质骨架上,ProteinMPNN 的序列恢复率为 52.4%,而 Rosetta 的为 32.9%。不同位置的氨基酸序列可以在单链或多链之间耦合,使其能够应用于当前蛋白质设计挑战的广泛范围。

图 1. ProteinMPNN 的整体架构

图 2. ProteinMPNN 的性能
2 参数
| 名称 | 说明 |
|---|---|
| chains_to_design | 需要预测的链 |
| seqs_per_struct | 生成的候选序列数量 |
| input_pdb | 三维结构的 PDB 文件 |
3 结果说明
返回两个文件,一个 .fasta 文件和一个 .csv 文件。
在 .fasta 文件中,第一条记录是原始序列,其余是预测序列。.fasta 文件中的描述包含以下关键信息:
| 名称 | 说明 |
|---|---|
| score | 设计的氨基酸的负对数概率在残基上的平均值。值越小越好 |
| global_score | 所有链中所有残基的负对数概率的平均值。值越小越好 |
| fixed_chains | 未设计的链(固定) |
| designed_chains | 被重新设计的链 |
| T=0.1 | 使用温度为 0.1 进行序列采样 |
| sample | 序列样本编号 1, 2, 3...等 |
| seq_recovery | 预测序列与原始序列的重叠程度 |
.fasta 文件中的每条链用 / 分隔。.csv 文件则提供了更友好的展示,每列的含义如下:
| 名称 | 说明 |
|---|---|
| type | 指示序列的类型 |
| description | 如 .fasta 文件中所述 |
chain: X |
被重新设计的链 X 的氨基酸序列 |
4 参考文献
[1] J. Dauparas et al., Robust deep learning–based protein sequence design using ProteinMPNN. Science378,49-56(2022). https://doi.org/10.1126/science.add2187

