2024-12-21 数码 0
智东西
作者 ZeR0
编辑 漠影
在大数据时代,ChatGPT的火焰已经点燃生命科学领域。
智东西3月30日报道,百度创始人李彦宏牵头的生命科学平台公司百图生科,在近日正式发布了其“生命科学版ChatGPT”——由生命科学大模型驱动的AI生成蛋白平台AIGP。
恰似人类自然语言可以拆解成26个字母、词、句子、段落的嵌套结构,生命语言可拆解成20个氨基酸字母、蛋白质、细胞、生命体。这种多重相似性,使得生成式AI不仅能写诗编程,也能被用于解决困扰生命科学科研人员已久的问题。
AIGP平台由百图生科在过去2年多时间内,由近300位AI BioTech专家组成跨国技术团队共同打造。根据不同模块的输入和要求,AIGP平台可在较短时间内设计和生成具有特定性质的蛋白质。
据介绍,这将大幅简化蛋白质生产流程,用几十分钟或几小时来设计蛋白质,几天就能把蛋白质制备出来。
其核心引擎是百图生科成立两年多以来一直致力于打造的生命科学大模型xTrimo。这款拥有千亿参数的大模型,从跨物种、跨模态的生命信息中学习了如何构建和实现功能,以及如何相互作用以及如何调控细胞功能。
有近20家合作伙伴已与百图生科开展AIGP联合研发合作,其方向涉及高性能弹头设计、新功能蛋白质设计、高通量验证等领域,其中多个项目取得了阶段性的发现成果。
一、大型AI Protein Design Platform AIGP:6月上线
目前,百图生科AIGP平台设置了3大功能模块:
(1)从Function to Protein Design(F2P):根据结构、功能需求优化并设计新型或改良现有蛋白,以满足用户需求;
(2)从Protein to Protein Design(P2P):针对抗原等目标protein进行特异结合antibody等protein设计;
(3)从Cell to Protein Design(C2P):基于细胞信息找到调控靶点并通过AIGP自动生成调控protein。
由于需要高度专业性,上述部分暂时不会面向公众开放,但计划于2023年6月起,将部分功能开放给专业用户使用,以激发更多研究潜力。
二、大型生物学模型xTrimo:预测速度快准确率超越AlphaFold
要充分吸收大量数据需融合创新做有机融合。该系统包括四层嵌套形式,最底层为对数据进行预训练,上层则分别为预训练对cell system及key parameter prediction model。此系统炼成过程是一个闭环涉及大模型体系、高通量验证、三大部分之一即数据平台既含大量公开数据也含自驾实验室产出的数据。
三,与合作伙伴一起进化:计划一年内发布更新版本
刘维透露,他们可能会在一年内发布更新版本,即AIGPA 1.0至今已经内部测试,并参与免疫调控药物ImmuBot开发工作,为新药开发提供支持。在未来的发展中,他们希望进一步提升能力,让更多非传统背景的人也能够参与到这一前沿科技中来。