蛋白质工程可直接对蛋白质分子进行操纵,借助突变的迭代积累,快速实现蛋白功能的优化和创新,在基础研究和产业应用中具有广泛潜力。
近日,中国科学院遗传与发育生物学研究所(以下简称遗传发育所)基于通用逆折叠模型,整合了结构与进化约束,开发出一种新型人工智能(AI)蛋白质工程计算模拟方法AiCE。
nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
▲AiCE方法概念图
该方法无需训练专属AI模型,即可实现蛋白质高效进化模拟和功能设计,成功实现了基因编辑工具效率和精度的快速提升。
01
攻克传统难题
蛋白质工程,是指利用蛋白质的灵活性,通过改变氨基酸序列,实现对其结构和功能进行修饰和改造的技术。运用该技术,可以让蛋白质演变速度,较自然演变实现指数级提升。
目前的蛋白质工程改造方法主要依赖实验人员经验,存在实验周期长、成本高等问题,限制了蛋白质工程的规模化应用。
此前科学家尝试通过训练特定蛋白专有的人工智能(AI)模型,实现突变模拟和功能改造。但AI模型在拓展应用到多种蛋白时,存在通用性欠佳、需要大量计算和实验成本等问题。
nload="this.removeAttribute('width'); this.removeAttribute('height'); this.removeAttribute('onload');" />
▲常见蛋白质工程方法的示意图和AiCE方法概述
遗传发育所团队基于现有通用蛋白质逆折叠AI模型,开发出AiCEsingle和AiCEmulti两类模块。
实验分析表明,AiCEsingle可以实现复杂蛋白和蛋白质-核酸复合物的有效进化,具有广泛的通用性,较其他常见AI模型,性能提升36%-90%。而AiCEmulti模块则用于预测突变组合位置,具有预测能力强、计算成本低的特点。
02
赋能多领域应用
研究团队建立的AiCE方法,包含AiCEsingle和AiCEmulti两类模块,可实现单突和组合突变的快速有效预测,只需1.15个CPU时,即可识别SpCas9蛋白的单突和双突变体。
研究团队还使用AiCE方法,在湿实验层面实现了包括脱氨酶、核定位序列、核酸酶和逆转录酶等8种结构和功能多样蛋白质的功能验证,证明了该方法的简单、高效和通用性。
借助优化的脱氨酶,研究团队还开发了可用于精准医疗和分子育种的新型碱基编辑器,包括编辑窗口缩小近一半的新型胞嘧啶碱基编辑器enABE8e、保真度提升1.3倍的新型腺嘌呤碱基编辑器enSdd6-CBE,以及活性提升13倍的新型线粒体碱基编辑器enDdd1-DdCBE。
与传统蛋白质工程方案相比,AiCE在效率、可扩展性和通用性方面均展现出显著优势。
来源:中国科学院遗传与发育生物学研究所
责任编辑:宋同舟