2024-12-21 数码 0
智东西
作者 ZeR0
编辑 漠影
ChatGPT这把火,已经烧到了生命科学界。
智东西3月30日报道,近日,百度创始人李彦宏牵头创立的生命科学平台公司百图生科,正式对外发布其“生命科学版ChatGPT”——由生命科学大模型驱动的AI生成蛋白平台AIGP。
恰如人类自然语言可以拆解成26个字母、词、句子、段落的嵌套结构,生命语言可拆解成20个氨基酸字母、蛋白质、细胞、生命体。如此多的相似性,使得生成式AI不仅能写诗编程,也能被用于解决困扰生命科学科研人员已久的难题。
AIGP平台由百图生科在过去2年多时间内,由近300位AI BioTech专家组成的跨国技术团队共同打造。根据不同模块的输入和要求,AIGP平台可在较短时间内设计和生成具有特定性质的蛋白质。
据介绍,这将大幅简化蛋白质生产流程,用几十分钟或几小时来设计蛋白质,再加上几天即可合成出这些蛋白质。这背后的核心引擎,是百图生科成立两年多以来一直致力于打造的大型生物学模型xTrimo,该模型拥有千亿参数,从跨物种、跨模态的生物信息中学习了如何构建和实现功能以及调控细胞功能等关键规律。
有近20家合作伙伴已与百图生科开展联合研发合作,其方向涉及高性能弹头设计、新功能蛋白设计、高通量验证药物组合效应预测等领域,其中多个项目取得了阶段性的发现成果。一方面是AIGP平台:3大功能模块,每一项核心能力今年6月上线;另一方面是生物科学大模型xTrimo:预测蛋白质结构速度比AlphaFold快100倍以上,更准确率高出三倍之上。
要充分吸收生命科学里的数据需将模型训练和工程上的创新融合。CTO兼首席AI科学家宋乐说,与ChatGPT一样,这需要经过专家的信息及高通量实验室数据输入才能调整到生成有用蛋white水平。而xTrimo炼成过程是一个闭环,它涉及大型系统、高通量验证数据平台三部分,并且既有大量公开数据也有自主实验室产出的数据。
他分享说经过一两年的打磨xTrimo能够预测速度比AlphaFold快100多倍,而且准确率比AlphaFold 2还要高出三倍以上使得在AIGP上设计更精准成功率更高做大型模型离不开长期研究投入而如果按传统逻辑去做研发可能会花费十亿美金而通过这种方式展现出了效率优势。
刘维CEO透露他们计划在一年内推出版本2.0希望它提供更多自主使用能力让开发者普及化使用此类服务并非为了赚取服务费用,而是希望帮助更多合作伙伴项目取得成功形成一种商业模式"Protein-as-a-Service"但目的不是短期利益,而是在5年后达到今天ChatGPT这样的水平。