2024-12-21 数码 0
智东西
作者 ZeR0
编辑 漠影
ChatGPT这把火,已经烧到了生命科学界。
智东西3月30日报道,近日,百度创始人李彦宏牵头创立的生命科学平台公司百图生科,正式对外发布其“生命科学版ChatGPT”——由生命科学大模型驱动的AI生成蛋白平台AIGP。
恰如人类自然语言可以拆解成26个字母、词、句子、段落的嵌套结构,生命语言可拆解成20个氨基酸字母、蛋白质、细胞、生命体。如此多的相似性,使得生成式AI不仅能写诗编程,也能被用于解决困扰生命科学科研人员已久的难题。
AIGP平台由百图生科在过去2年多时间内、近300位AI BioTech专家组成的跨国技术团队共同打造。根据不同模块的输入和要求,AIGP平台可在较短时间内设计和生成具有特定性质的蛋白质。
据介绍,这将大幅简化蛋白质生产流程,用几十分钟或几小时来设计蛋白质,再加上几天即可合成出所需蛋白质。这背后的核心引擎,是百图生科成立两年多以来一直致力于打造的生物学大模型xTrimo。该模型拥有千亿参数,从跨物种与跨模态生物信息中学习了如何构建功能性及调控细胞功能规律。
目前,有近20家合作伙伴已与百图生科开展联合研发合作,其方向涉及高性能弹头设计、新功能蛋白设计等领域,其中部分项目取得了阶段性的发现成果。一旦开放,将为专业用户提供自主使用能力,让他们能够直接调用AI产生的大量数据资源进行研究探索。
二是生物学大模型xTrimo:预测速度远超AlphaFold
AIGP背后的千亿级别的大模型体系采用四层嵌套形式,最底层进行数据预训练,上层逐渐增强至针对特定参数预测。此系统通过融合创新而非单一依赖于传统方法,如同ChatGPT需要人类反馈以输出舒适交流一样,以专家信息及实验室数据调整到生成有用蛋白水平。此闭环过程包括模型、高通量验证和数据三部分,对公开以及自行实验室产出的数据进行整合使之更加精准且高效。
经过两年的磨砺,xTrimo可以比AlphaFold更快100倍以上甚至达到300倍以上,并且准确率超过了AlphaFold 2三倍以上,使得在AIGP上的设计更精确,更成功。在保持长期高额研发投入的情况下,比起传统逻辑可能节约成本数十亿美元,而现实中的效率显著提升表示这一模式正在实现转型变革。
刘维CEO透露,他们计划一年后推出更新版本,即AIGP 2.0希望它能提供更多自主使用能力,让广泛开发者都能使用,并推进前沿药物项目成功。他认为这是一个新的起点,同时也是挑战,这也就意味着要不断吸纳新伙伴以进一步理解进化和提高泛化能力。而他坚信,在5年之后,AIGP会达成今天大家看到完全不同的水平。