我国学者在人工智能辅助抗体设计领域取得新进展

日期 2023-04-10　来源：信息科学部　作者：肖斌吴国政赵瑞珍谢国廖清　【大中小】　【打印】　【关闭】

图研究成果MEAN与美国麻省理工学院RefineGNN的对比。（A）CDR-H3对比。图中灰色部分表示抗原，绿色和红色表示抗体的重链和轻链，左下角是真实的氨基酸序列以及算法生成的氨基酸序列，图中方框的地方是算法生成的CDR-H3的3维结构。（B）亲和力对比。图中绿色区域是数据集中原始抗体针对目标抗原的亲和力密度分布曲线，橙色和蓝色区域分别是RefineGNN和MEAN对抗体进行优化后的亲和力密度分布曲线

　　在国家自然科学基金项目（批准号：61925601、62006137）资助下，清华大学计算机科学与技术系、智能产业研究院刘洋教授课题组与中国人民大学高瓴人工智能学院黄文炳助理教授合作，在人工智能辅助抗体设计领域取得新进展，相关研究成果以“基于三维等变图翻译的条件式抗体设计（Conditional Antibody Design as 3D Equivariant Graph Translation）”为题，于2023年3月21日获得人工智能领域重要国际会议ICLR 2023杰出论文提名（Outstanding Paper Honorable Mention）。论文链接：https://openreview.net/pdf?id=LFHFQbjxIiP。

　　抗体是免疫系统用来鉴别和中和外来细菌、病毒等病原体的大型Y形蛋白质，抗体类药物在自身免疫疾病和癌症的治疗中发挥了不可估量的重要作用。抗体的设计和优化极具挑战性，主要体现在三个方面：首先，氨基酸序列的搜索空间巨大，每个CDR的氨基酸组合共有约1万亿种可能性，而抗体设计需要考虑多个CDR；其次，抗体结构存在复杂的内外部物理作用，抗体在自身氨基酸相互作用下形成的三维结构需要与抗原特别是其表位的三维结构紧密结合；最后，抗体设计需要遵循物理定律的对称性，不应受三维坐标系的平移和旋转影响。

　　团队提出了一种基于深度学习的抗体设计方法——多通道等变注意力网络（Multichannel Equivariant Attentive Network, 简称MEAN）。该方法巧妙地借鉴端到端神经机器翻译技术的核心思想，将抗体生成视为三维等变图翻译问题：给定抗体-抗原三维复合体，输出抗体CDR区域一维氨基酸序列和对接后的三维结构。MEAN利用等变图神经网络直接在三维空间处理蛋白质结构，有效克服了传统方法仅能在预处理阶段纳入三维结构信息的局限性，通过充分利用目标抗原的完整信息和抗体的完整可变区域对抗体的复杂内外部物理作用进行建模，高效同步生成满足物理定律对称性的抗体CDR区域一维序列和三维结构，具有很强的抗原靶向特性、表达能力和泛化能力。在靶向抗原的抗体设计任务上，MEAN的CDR氨基酸重构精度比麻省理工学院提出的RefineGNN提高了23%。在亲和力优化任务上，MEAN优化后抗体的吉布斯自由能差变化ddG比RefineGNN提高了34%。图（A）对比了MEAN与RefineGNN的差异，MEAN生成的CDR氨基酸序列“ANGDGDY”更接近真实序列“ANWAGDY”，对应的三维结构与真实结构几乎完全重合。图（B）展示了两种方法优化后的抗体对目标抗原的亲和力值分布，与原始抗体（即RAbD）的亲和力相比，经过MEAN优化后的抗体，亲和力得到大幅度提升（亲和力值越小表示结果越好），显著超过了RefineGNN。