

AbAtlas
1 简介
AbAtlas 是一个用于抗体序列降维和可视化的工具,能够将抗体序列映射到二维和三维图形中。该工具利用了 Observed Antibody Space1(OAS)数据库的数据,涵盖了六种主要物种(人类、小鼠、大鼠、恒河猴、骆驼和兔子)的重链和轻链,以及它们的 germline 基因。通过结合 AntiBERTy2 和 UMAP3,AbAtlas 能够生成高质量的序列嵌入,并有效地进行降维处理。只需输入抗体序列,AbAtlas 将自动分析该序列,并通过可视化图形直观地展示其与不同物种或不同 V 基因家族的抗体链之间的相似性,从而快速识别输入序列的特征。
2 参数说明
- Sequences:输入抗体重链或轻链的Fv区的氨基酸序列或碱基序列。
- Species:选择特定的一个物种,或选择Match,工具将自动匹配物种。
- Cgene Species:选择C基因的物种,目前仅支持小鼠、人类和大鼠。
- Components: 3D或2D。
- Annotation: 可选择人类V基因家族(Human V gene family) 或 不同物种(Species)作为标注依据。
- Control Samples:对照样本数量,数值范围 10,000 到 100,000。将从OAS数据的各个物种链中采样该数量的样本作为对照。
3 结果说明
- chart, 2D或3D图, 红色菱形(input)的点为输入的序列,圆形的点为对照样本。

Figure 1. 2D Chart of AbAtlas on 20,000 control samples.

Figure 2. 3D Chart of AbAtlas on 20,000 control samples.
4 参考文献
[1] Olsen T H, Boyles F, Deane C M. Observed Antibody Space: A diverse database of cleaned, annotated, and translated unpaired and paired antibody sequences[J]. Protein Science, 2022, 31(1): 141-146. https://doi.org/10.1002/pro.4205
[2] Ruffolo J A, Gray J J, Sulam J. Deciphering antibody affinity maturation with language models and weakly supervised learning[J]. arXiv preprint arXiv:2112.07782, 2021. https://doi.org/10.48550/arXiv.2112.07782
[3] McInnes L, Healy J, Melville J. Umap: Uniform manifold approximation and projection for dimension reduction[J]. arXiv preprint arXiv:1802.03426, 2018. https://doi.org/10.48550/arXiv.1802.03426

