2024-12-21 数码 0
智东西
作者 ZeR0
编辑 漠影
ChatGPT这把火,已经烧到了生命科学界。
智东西3月30日报道,近日,百度创始人李彦宏牵头创立的生命科学平台公司百图生科,正式对外发布其“生命科学版ChatGPT”——由生命科学大模型驱动的AI生成蛋白平台AIGP。
恰如人类自然语言可以拆解成26个字母、词、句子、段落的嵌套结构,生命语言可拆解成20个氨基酸字母、蛋白质、细胞、生命体。如此多的相似性,使得生成式AI不仅能写诗编程,也能被用于解决困扰生命科学科研人员已久的难题。
AIGP平台由百图生科在过去2年多时间内,由近300位AI BioTech专家组成的跨国技术团队共同打造。根据不同模块的输入和要求,AIGP平台可在较短时间内设计和生成具有特定性质的蛋白质。
据介绍,这将大幅简化蛋白质生产流程,用几十分钟或几小时来设计蛋白质,再加上几天即可合成出所需蛋白质。这背后的核心引擎,是百图生科成立两年多以来一直致力于打造的生物学大模型xTrimo,该模型拥有千亿参数,从跨物种到跨模态的大量生物信息中学习了构建功能性与调控机制规律。
目前,有近20家合作伙伴已与百图生科开展联合研发合作,其方向涉及高性能弹头设计、新功能蛋白设计等领域,其中部分项目已经取得阶段性的发现和研究成果。一方面是AIGP平台3大功能模块:从功能到蛋白(F2P)、从蛋白到蛋 白(P2P)以及从细胞到蛋 白(C2P),每一项都配备12项核心能力,以满足专业用户需求;另一方面是生物学大模型xTrimo,它预测速度超过AlphaFold,并且准确率远超之上。
要充分吸收大量数据并融入创新工程,对于实现精确预测至关重要。宋乐CTO兼首席AI科学家表示,“ChatGPT依赖于人类反馈来输出舒适交流”,同样地,“AI生成蛋白也是如此”,需要通过专家的指导及实验室数据进行调整,以确保能够产生有用的新颖突破性产品。此过程是一个闭环,不断迭代优化以提升效率和准确度。
为了推进这一前沿科技发展,与传统药物开发相比,将省去数十亿美元投资。在接下来的一年里,计划发布更为完善版本,即AIGP 2.0,让更多专业用户能够自主使用该系统,为他们提供前沿研究工具,而非仅限于服务商模式。刘维CEO希望通过这样的方式促进更多合作伙伴共享成功故事,并期待5年后将此技术带至全新的高度,就像OpenAI ChatGPT一样经历了显著变化。