
工具目录

专利序列相似性检索
抗体序列分析
2025-09-19
立即尝试
Similarity AbScan
1 简介
Similarity AbScan 是一个专门用于抗体序列专利文献相似性检索的工具,拥有一个全面的来自权威网站的数据库,分为Antibody和Nanobody两个子数据库。
Nanobody子数据库包含近5,000条来自专利和学术论文的VHH、VNAR 和单域抗体序列。Antibody子数据库包含67万多条重轻链抗体序列,以及17万对通过专利和学术论文配对的抗体序列。用户可以通过输入序列来检索相似的抗体序列或结构,也可以通过关键字检索相关的抗体。
配对抗体序列中,包含:
- Patented Antibodies(patent in heavy definition) 134,183,占比75.3%。
- Crystal Structures(Xtal structure) 12,778,占比7.1%。
- Therapeutic Antibodies(TheraSAbDab) 1,198,占比0.6%。
- Scientific Literature(Other) 28,735,占比16.9%。

Figure 1. 配对抗体序列不同来源分布图

Figure 2. 配对抗体序列不同物种分布图
2 参数说明
- Similar AbScan DB Name:可选Antibody子数据库或Nanobody子数据库。
- 结构搜索:
- Fv Heavy sequence: 抗体重链Fv区序列。
- Fv Light sequence: 抗体轻链链Fv区序列。
- RMSD cutoff (Å): 结构 RMSD 阈值 (Å)。
- 序列搜索:
- Fv Heavy sequence: 抗体重链Fv区序列。
- Fv Light sequence: 抗体轻链链Fv区序列。
- Average Identity: 重轻链序列平均相似性阈值(%)。
- Heavy Identity Cutoff (%): 重链序列相似性阈值(%)。
- Light Identity Cutoff (%): 轻链序列相似性阈值(%)。
- Regions: 检索的抗体区间,可选 whole, cdrs, cdr3。
- 关键词搜索:
- Keyword: 使用正则表达式搜索原始文献标题中包含的关键词, 例如“RSV|Respiratory Syncytial Virus”,“PDL1”。
- Pair: 抗体对搜索或重链/轻链搜索。
- Max Sequences Return: 返回最大的序列数量。
3 结果说明
Table: 检索结果表,支持下载,包含以下关键字段:
| 字段 | 说明 |
|---|---|
| ID | GeneBank LOCUS |
| sequence | Fv of GeneBank Sequence |
| organism | GeneBank Organism |
| definition | GeneBank DEFINITION |
| reference_authors | GeneBank REFERENCE AUTHORS |
| reference_title | GeneBank REFERENCE TITLE |
| update_date | GeneBank Update date |
| cdr_lengths | CDR Sequence Lengths |
| pairing | Pairing Method |
| targets_mentioned | Targets |
| url | Pairing Basis Link |
| chain | Chain Type |
| division | GeneBank Division, such as PAT |
| GeneBank_accession-version | GeneBank ACCESSION VERSION |
| other-seqids | other sequence ids |
| model | GeneBank LOCUS Of Structure |
| identity | Sequence identity with the query sequence |
| rmsd | Structure RMSD with the query sequence |
| cdr1/2/3 | cdr1/2/3 Sequence |
| cdr1/2/3 mismatch | cdr1/2/3 mismatch with the query sequence |
| cdrs mismatch | cdrs mismatch with the query sequence |
| total_mismatch | total mismatch with the query sequence |
备注:
- Antibody子数据库的结构搜索仅支持抗体对搜索,必须输入抗体对,返回也仅包含抗体对(Pair)的结果表。
- Antibody子数据库的序列搜索支持抗体对、重链和轻链搜索,返回包含抗体对(Pair)、重链(H)和轻链(L)的结果表。
- Antibody子数据库的关键字搜索支持抗体对、重链和轻链搜索,返回抗体对(Pair)或重链(H)、轻链(L)的结果表。
4 参考文献
[1] Abanades B, Olsen TH, Raybould MIJ, et al. The Patent and Literature Antibody Database (PLAbDab): an evolving reference set of functionally diverse, literature-annotated antibody sequences and structures. Nucleic Acids Res. 2024;52(D1):D545-D551. https://doi.org/10.1093/nar/gkad1056

