AbSeek™：人工智能驱动的抗体设计与优化计算方法

行业洞察

抗体药物研发正在从“构建文库—筛选验证—反复试错”的传统路径，逐步转向由计算生物学与结构生物学共同驱动的预测式设计。对于单抗、双抗、ADC 及纳米抗体等研发任务而言，研发团队不仅需要找到能够结合靶点的候选序列，更需要在早期同步评估亲和力、免疫原性、稳定性、聚集风险与多链装配风险。缺乏可落地的计算方法，会使大量实验资源消耗在低价值候选分子的验证上，并将成药性风险推迟到后期才暴露。

因此，工业化抗体研发需要的不只是单点算法，而是能够把序列、结构、功能与成药性关联起来的完整计算体系。只有当 AI 模型与真实实验数据、结构预测、亲和力检测和成药性验证形成闭环，计算结果才可能真正服务于候选分子优先级排序和后续实验决策。

导语

赛业生物 AbSeek^TM 智能计算平台以“人工智能 + 结构生物学”为内核，构建覆盖抗体设计全流程的计算方法体系。从序列预测到成药性优化，AbSeek^TM 通过 AI 计算方法建立“序列 → 结构 → 功能 → 成药性”的量化关联模型，帮助抗体开发从“依赖实验”走向“计算引领”。

抗体设计的计算革命：从经验试错到数据预测

抗体作为复杂的生物大分子，其亲和力、稳定性、免疫原性等关键属性，本质上由氨基酸序列与三维结构决定。传统实验驱动的研发模式在以下环节存在明显瓶颈：

序列—功能关联难：仅凭序列难以快速预判抗体与抗原的结合能力，通常需要大量 SPR/BLI 实验验证。
结构—成药性耦合复杂：抗体聚集、热稳定性不足等问题需通过 SEC-HPLC、DSC 等实验逐一排查，后期整改成本较高。
多抗设计计算复杂度高：双抗或多抗的轻重链错配、表位协同性等风险缺乏有效预判工具，往往依赖经验构建突变体。

AbSeek^TM 的核心价值在于以 AI 计算方法建立抗体序列、结构、功能与成药性之间的定量关联，让候选分子筛选更早进入可预测、可排序、可验证的研发状态。

AbSeek^TM 计算方法的核心架构：数据、模型与算法的深度融合

AbSeek^TM 并非单一计算工具，而是一套“多源数据驱动 + 多模态模型融合 + 多环节算法覆盖”的抗体计算体系，为抗体设计、评价与优化提供底层计算支撑。

1. 数据基础：构建工业级抗体计算数据库

计算方法的准确性始于高质量数据。AbSeek^TM 整合公共数据库与赛业生物自有实验数据，降低纯公共数据模型与真实研发场景脱节的风险。

公共数据深度挖掘：解析 OAS（Observed Antibody Space）数据库中的大规模抗体序列，提取人类免疫球蛋白基因家族（IGHV、IGKV、IGLV）的序列特征与突变规律；同时利用 SAbDab 中 10,000+ 结构解析的抗体–抗原复合物信息，为空间构象预测与界面建模提供训练基础。
自有实验数据赋能：融入赛业生物多年抗体开发积累的百万级实验数据，包括超一千组抗体表达和亲和力数据、数百组成药性检测和体内药效相关数据，以及 HUGO 系列小鼠筛选的全人源抗体序列、双抗错配率实验数据等，使模型训练更贴近工业界实际需求。

两类数据的融合，使 AbSeek^TM 计算模型在工业适配性方面优于仅依赖公共数据的平台。在亲和力预测中，针对 ADC 偶联抗体等研发场景，模型预测偏差较纯公共数据模型降低 40%。

2. 模型架构：多模态 AI 模型协同

AbSeek^TM 采用“NLP + 结构生物学”的多模态模型融合架构，从序列语义、空间构象与多任务学习等维度计算抗体属性。

NLP 模型：用于抗体序列特征解析。在 Humanness 评估中，模型通过 Transformer 架构学习人类免疫球蛋白的序列语义，形成可用于人源化程度判断的评分体系。
结构预测模型：基于类 AlphaFold3 架构的抗体–抗原复合物结构预测算法，预测抗体 CDR 区与抗原表位的结合构象，为亲和力计算提供结构基础。
多任务学习模型：将多类 PTM 风险位点、成药性评估等任务联合训练，实现“一条序列，多属性同步计算”，提升模型泛化能力。

四大关键计算模块：破解抗体设计全流程难题

AbSeek^TM 的计算方法围绕抗体设计全流程的关键痛点，形成四类定向计算模块，以可量化的指标辅助候选分子筛选与优化。

1. 抗体人源化程度评估：免疫原性的预筛选器

抗体的人源化程度直接影响临床抗药抗体（ADA）发生风险。传统人源化评估通常依赖数据库比对和后续实验验证，缺乏全局量化判断。AbSeek^TM 通过 NLP 驱动的计算方法进行快速评估。

计算原理：围绕抗体可变区（Fv）及相关序列片段提取氨基酸序列特征，识别序列物种类别与人类免疫球蛋白序列相似性，并输出 0–1 的 Humanness 评分，其中 ≥0.95 可作为低免疫原性阈值参考。
计算优势：无需先行构建大量人源化突变体，10 秒内即可完成 100 条序列的评分，适合早期候选序列快速预筛。
实际验证：在某 PD-L1 抗体项目中，AbSeek^TM 计算出 3 条评分 ≥0.95 的序列，后续 huHSC 小鼠实验显示其 ADA 发生率均 <5%；评分 <0.9 的序列 ADA 发生率为 18%–25%，计算准确率超过 90%。

2. 抗体–抗原亲和力计算：精准锁定高活性分子

亲和力（KD 值）是抗体药效相关评价中的核心指标之一。传统实验检测成本高、通量有限，AbSeek^TM 通过结构预测与界面特征建模提高亲和力预判效率。

计算逻辑：使用类 AlphaFold3 模型预测抗体–抗原复合物三维结构，定位 CDR 区与抗原表位结合界面；再基于几何深度学习架构的亲和力预测模型，提取抗原–抗体结合界面的结构特征，进而预测两者结合亲和力（KD 值）。
计算精度：在 100 组单抗 KD 值预测中，AbSeek^TM 与 SPR 实验结果的相关性达 0.6，预测偏差 <15%，优于行业传统方法约 0.3–0.4 的相关性水平。
成本价值：在某 VEGF 抗体筛选项目中，通过 AbSeek^TM 计算仅需验证 20 条序列即可获得 KD<0.1 nM 的分子，相比全库实验筛选需验证 100 条序列的方式，检测成本降低 80%。

3. Blocking 活性计算：功能机制的提前验证

抗体的 Blocking 活性，即阻断抗原–受体相互作用的能力，通常需要细胞水平实验验证。传统流程耗时可达 1–2 个月，AbSeek^TM 通过“结构对接 + 能量竞争”计算方法提前预判功能活性。

计算流程：构建抗原–受体复合物参考结构，例如 PD-1/PD-L1 复合物；模拟抗体与抗原结合过程，计算抗体对抗原–受体结合界面的空间占位率；再比较抗体–抗原结合能与抗原–受体结合能，评估竞争优势并输出 Blocking 预测值。
应用验证：在 PD-1/PD-L1 双抗开发中，AbSeek^TM 对 5 个抗体的 Blocking 预测结果与后续阻断活性实验结果相吻合。
效率提升：Blocking 活性验证周期可由 1–2 个月压缩至约 1 天，为后续成药性优化争取更早的决策窗口。

4. 成药性多参数计算优化：规避后期失败风险

抗体的成药性，包括聚集风险、热稳定性、pH 稳定性与多链正确装配能力，是临床转化的重要门槛。AbSeek^TM 通过多维度计算实现早期风险预判与序列优化。

聚集风险计算：基于超过 10 万种蛋白质序列聚集性数据集训练出的卷积–注意力混合神经网络，从序列层面预测蛋白质聚集倾向。某 ADC 项目中，AbSeek^TM 预测 1 条候选单体存在高聚集风险，后续 SEC-HPLC 验证聚集率达 18.7%，帮助项目及时淘汰风险分子。
热稳定性计算优化：通过 TemBERTureTm 模型预测抗体热稳定性 Tm 值，并结合点突变策略评估氨基酸替换对 Tm 值的影响。某抗 HER2 抗体经计算优化后，Asn→Gln 突变使 Tm 值从 58℃提升至 65℃，满足制剂稳定性要求。
双抗错配率计算：针对 AbPair 模型评估双抗中不同重轻链自然配对的可能性，筛除无法自然配对的组合，从而提升双抗正确组装率。

计算方法的落地价值：效率与成本的双重突破

AbSeek^TM 的计算方法深度融入赛业生物“计算 + 实验”的全链条研发体系，强调以计算指导实验、以实验反馈优化模型，解决 AI 计算工具落地难的问题。

1. 与实验平台协同：计算指导实验，减少无效试错

AbSeek^TM 与 HUGO-Light^TM 共轻链小鼠、HUGO-Nano^TM 纳米抗体鼠形成“计算筛选—实验验证”闭环。

案例：Claudin 18.2/CD3 双抗开发

某 Biotech 需开发 Claudin 18.2/CD3 双抗。传统流程需从 HUGO-Light^TM 小鼠中筛选 200 条抗体并逐一实验验证，整体周期约 12 个月。通过 AbSeek^TM 计算方法介入后：

先从 HUGO-Light^TM 免疫库中获取 50 条高亲和力（KD<0.5 nM）候选序列；
通过 AbSeek^TM 四大计算模块快速评估：Humanness 评分筛选出 15 条低免疫原性序列，Blocking 活性计算保留 10 条高功能活性序列，成药性计算排除 3 条高聚集风险序列；
最终仅需实验验证 7 条序列即可确定 PCC 候选分子，研发周期缩短至 6 个月，实验成本降低 70%。

2. 降低计算门槛：让工业界轻松应用专业计算能力

针对中小企业缺乏计算生物学团队的痛点，AbSeek^TM 提供低门槛计算服务，使抗体研发团队能够更便捷地应用专业计算能力。

可视化计算界面：无需编程基础，上传抗体序列即可自动生成 Humanness 评分、KD 值预测与成药性风险报告。
定制化计算方案：针对 ADC、双抗等特殊研发需求，提供 ADC 抗体偶联位点稳定性计算、双抗表位距离计算等定向计算服务。
计算结果解读支持：配套专业计算工程师，解读计算报告背后的生物学意义，辅助确定后续实验方向。

AbSeek^TM 计算方法的差异化竞争力

在 AI 抗体设计工具快速发展的市场中，AbSeek^TM 的核心优势在于计算方法的工业级适配性与可验证性。

数据优势：百万级自有实验数据让模型更贴近工业抗体开发任务，减少纯公共数据模型“实验室精准、工业界失效”的风险。
全流程计算覆盖：从 Humanness 评估到亲和力预测、Blocking 活性计算与成药性优化，覆盖抗体设计关键环节，无需频繁切换多套计算工具。
可验证性：每一步计算结果均可通过赛业生物实验平台，如 SPR、DSC、体内药效模型等进行验证，形成“计算—实验”闭环。

计算驱动未来：重塑抗体研发范式

当 AI 计算方法从辅助工具升级为研发决策的重要驱动力，抗体研发正在迎来“设计周期缩短 50%、成本降低 60%”的效率变革。AbSeek^TM 的计算方法不仅是一套技术体系，更是对传统研发模式的重构——它让抗体设计从“依赖经验的艺术”，逐步走向“基于数据的科学”。

未来，随着 AlphaFold3 高精度多链结构预测、单细胞免疫库测序数据等能力持续融入，AbSeek^TM 将进一步探索从靶点结构直接设计抗体序列的“零实验”设计路径，推动抗体研发进入“计算引领、实验验证”的新阶段。

对于药企与 Biotech 而言，AbSeek^TM 智能计算平台提供了一套可落地、可验证、覆盖全流程的抗体计算解决方案，让研发效率提升从概念变成可量化的项目成果。