tool-banner
工具目录
首页>工具目录>

专利序列相似性检索

Similarity AbScan
专利序列相似性检索
抗体序列分析
2025-09-19
立即尝试

Similarity AbScan

1 简介

Similarity AbScan 是一个专门用于抗体序列专利文献相似性检索的工具,拥有一个全面的来自权威网站的数据库,分为Antibody和Nanobody两个子数据库。

Nanobody子数据库包含近5,000条来自专利和学术论文的VHH、VNAR 和单域抗体序列。Antibody子数据库包含67万多条重轻链抗体序列,以及17万对通过专利和学术论文配对的抗体序列。用户可以通过输入序列来检索相似的抗体序列或结构,也可以通过关键字检索相关的抗体。

配对抗体序列中,包含:

  • Patented Antibodies(patent in heavy definition) 134,183,占比75.3%。
  • Crystal Structures(Xtal structure) 12,778,占比7.1%。
  • Therapeutic Antibodies(TheraSAbDab) 1,198,占比0.6%。
  • Scientific Literature(Other) 28,735,占比16.9%。
similar_abscan_1

Figure 1. 配对抗体序列不同来源分布图


similar_abscan_2

Figure 2. 配对抗体序列不同物种分布图


2 参数说明

  • Similar AbScan DB Name:可选Antibody子数据库或Nanobody子数据库。
  • 结构搜索:
    • Fv Heavy sequence: 抗体重链Fv区序列。
    • Fv Light sequence: 抗体轻链链Fv区序列。
    • RMSD cutoff (Å): 结构 RMSD 阈值 (Å)。
  • 序列搜索:
    • Fv Heavy sequence: 抗体重链Fv区序列。
    • Fv Light sequence: 抗体轻链链Fv区序列。
    • Average Identity: 重轻链序列平均相似性阈值(%)。
    • Heavy Identity Cutoff (%): 重链序列相似性阈值(%)。
    • Light Identity Cutoff (%): 轻链序列相似性阈值(%)。
    • Regions: 检索的抗体区间,可选 whole, cdrs, cdr3。
  • 关键词搜索:
    • Keyword: 使用正则表达式搜索原始文献标题中包含的关键词, 例如“RSV|Respiratory Syncytial Virus”,“PDL1”。
    • Pair: 抗体对搜索或重链/轻链搜索。
  • Max Sequences Return: 返回最大的序列数量。

3 结果说明

Table: 检索结果表,支持下载,包含以下关键字段:

字段 说明
ID GeneBank LOCUS
sequence Fv of GeneBank Sequence
organism GeneBank Organism
definition GeneBank DEFINITION
reference_authors GeneBank REFERENCE AUTHORS
reference_title GeneBank REFERENCE TITLE
update_date GeneBank Update date
cdr_lengths CDR Sequence Lengths
pairing Pairing Method
targets_mentioned Targets
url Pairing Basis Link
chain Chain Type
division GeneBank Division, such as PAT
GeneBank_accession-version GeneBank ACCESSION VERSION
other-seqids other sequence ids
model GeneBank LOCUS Of Structure
identity Sequence identity with the query sequence
rmsd Structure RMSD with the query sequence
cdr1/2/3 cdr1/2/3 Sequence
cdr1/2/3 mismatch cdr1/2/3 mismatch with the query sequence
cdrs mismatch cdrs mismatch with the query sequence
total_mismatch total mismatch with the query sequence

备注:

  • Antibody子数据库的结构搜索仅支持抗体对搜索,必须输入抗体对,返回也仅包含抗体对(Pair)的结果表。
  • Antibody子数据库的序列搜索支持抗体对、重链和轻链搜索,返回包含抗体对(Pair)、重链(H)和轻链(L)的结果表。
  • Antibody子数据库的关键字搜索支持抗体对、重链和轻链搜索,返回抗体对(Pair)或重链(H)、轻链(L)的结果表。

4 参考文献

[1] Abanades B, Olsen TH, Raybould MIJ, et al. The Patent and Literature Antibody Database (PLAbDab): an evolving reference set of functionally diverse, literature-annotated antibody sequences and structures. Nucleic Acids Res. 2024;52(D1):D545-D551. https://doi.org/10.1093/nar/gkad1056

0