

PTM-Blocker
1 简介
翻译后修饰(PTM)是蛋白质功能、稳定性及相互作用的关键调控者,在细胞信号传导、定位及疾病机制中至关重要。但实验鉴定PTM(如质谱、蛋白质印迹、放射性标记技术)成本高、耗时长,计算方法成为替代方案。传统计算模型仅依赖PTM位点周围局部序列特征,现有预训练蛋白质语言模型(PLM)多仅基于氨基酸序列,缺乏结构信息,且多为单任务模型,无法跨PTM类型共享特征、实现知识迁移,限制预测性能。
MTPrompt-PTM针对上述痛点,基于结构感知PLM(S-PLM),结合提示调优、多任务学习与知识蒸馏,可预测13种PTM位点,在磷酸化、糖基化等修饰上均超越MusiteDeep、PTMGPT2等主流工具,为PTM位点的高效定位提供了可靠方案。

图 1. MTPrompt-PTM模型架构示意图

图 2. MTPrompt-PTM模型性能
PTM阻断不仅需要精准定位修饰位点,还需评估位点突变对蛋白整体功能的影响。VespaG作为一款超快的错义突变效应预测工具,VespaG以蛋白质语言模型(pLM)嵌入为输入,借助GEMME进化分数作为伪标签训练轻量深度学习模型,在保持与主流方法(如 GEMME、AlphaMissense)相当的预测精度。

图 3. VespaG模型架构示意图
PTM-Blocker工具串联MTPrompt-PTM与VespaG,一键完成预测PTM风险位点与突变改造带来的影响。同时我们汇总了常见PTM类型、涉及氨基酸位点或序列motif,以及通常采用的定点替换突变方案(具体见下表)。
需要说明的是,所推荐的突变方案并非万无一失。因此,PTM-Blocker会对所有潜在PTM风险位点开展饱和突变,并在结果文件中明确标注各突变是否属于推荐方案,详见“3 结果说明”。
| PTM | AA/Motif | Mutation |
|---|---|---|
| Phosphorylation | S | A |
| Phosphorylation | T | A |
| Phosphorylation | Y | F |
| N-Linked Glycosylation | N | Q |
| N-Linked Glycosylation | NXS/T | NXA |
| Ubiquitination | K | R |
| Acetylation | K | R |
| Acetylation | K | A |
| SUMOylation | K | R |
| Methylation | K | A |
| Methylation | K | Q |
| Methylation | R | A |
| Methylation | R | G |
| Succinylation | K | R |
| Succinylation | K | A |
| O-Linked Glycosylation | S | A |
| O-Linked Glycosylation | T | A |
| Palmitoylation | C | S |
| Palmitoylation | C | A |
2 参数
| 名称 | 说明 |
|---|---|
| Sequences | 氨基酸序列或fasta文件 |
| PTM Type | 选择预测PTM的类型 |
3 结果说明
结果为两个 .csv 表格文件,ptm_site_predictions.csv与ptm_reform_evaluation.csv
ptm_site_predictions.csv中每列的含义为:
| 名称 | 说明 |
|---|---|
| prot_id | 氨基酸序列ID |
| position | 预测为PTM风险的位点 |
| probability | MTPrompt-PTM预测的分数,范围为[0,1],越高代表越有可能被修饰 |
| ptm_type | 预测的PTM类型 |
| wildtype | 涉及的氨基酸 |
ptm_reform_evaluation.csv中每列的含义为:
| 名称 | 说明 |
|---|---|
| prot_id | 氨基酸序列ID |
| ptm_type | 预测的PTM类型 |
| ptm_position | 预测为PTM风险的位点 |
| ptm_wildtype | 改造前的氨基酸类型 |
| ptm_probability | MTPrompt-PTM预测的分数,范围为[0,1],越高代表越有可能被修饰 |
| mutation | 突变表示,如S35A表示为第35号位点,由S突变为A |
| is_rule_mutation | 是否属于我们提供的替换突变方案 |
| vespag_score | VespaG预测的分数,范围为[0,1],越高代表越有突变后功能影响越大 |
4 参考文献
[1] Han Y, He F, Shao Q, Wang D, Xu D. MTPrompt-PTM: A Multi-Task Method for Post-Translational Modification Prediction Using Prompt Tuning on a Structure-Aware Protein Language Model. Biomolecules. 2025; 15(6):843. https://doi.org/10.3390/biom15060843
[2] Marquet C, Schlensok J, Abakarova M, Rost B, Laine E. Expert-guided protein language models enable accurate and blazingly fast fitness prediction. Bioinformatics. 2024; 40(11):btae621. https://doi.org/10.1093/bioinformatics/btae621

