2024-12-21 数码 0
智东西
作者 ZeR0
编辑 漠影
ChatGPT这把火,已经烧到了生命科学界。
智东西3月30日报道,近日,百度创始人李彦宏牵头创立的生命科学平台公司百图生科,正式对外发布其“生命科学版ChatGPT”——由生命科学大模型驱动的AI生成蛋白平台AIGP。
恰如人类自然语言可以拆解成26个字母、词、句子、段落的嵌套结构,生命语言可拆解成20个氨基酸字母、蛋白质、细胞、生命体。如此多的相似性,使得生成式AI不仅能写诗编程,也能被用于解决困扰生命科学科研人员已久的难题。
AIGP平台由百图生科在过去2年多时间内,由近300位AI BioTech专家组成的跨国技术团队共同打造。根据不同模块的输入和要求,AIGP平台可在较短时间内设计和生成具有特定性质的蛋白质。
据介绍,这将大幅简化蛋白质生产流程,用几十分钟或几小时来设计蛋白质,再加上几天即可合成出所需蛋白质。这背后的核心引擎,是百图生科成立两年多以来一直致力于打造的生物学大模型xTrimo,该模型拥有千亿参数,从跨物种到跨模态的大量生物信息中学习了构建功能性与调控机制规律。
有近20家合作伙伴已与百图生科开展AIGP联合研发合作,其中涉及高性能弹头设计、新功能蛋白设计等领域,一些项目取得了阶段性的发现成果。
一.AIGP平台:3大功能模块,12项核心能力,将于今年6月上线。目前,其设置了三大功能模块:
Function to Protein Design(F2P):从功能到蛋白设计,为用户提供优化参数能力,以满足合成生物学公司和酶类公司等行业需求。
Protein to Protein Design(P2P):从特定目标蛋白到其他结合类型抗体等新型分子,比如针对新冠病毒或渐冻症产生特殊抗体。此部分提供四个关键点:亲和力、高精准表位、高特异性、高序列差异化。
Cell to Protein Design(C2P):从细胞给定靶点进行调控,并直接生成相应调控作用药物,如胃癌靶点分析后快速创建抗体系列产品。该模块包含细胞分类、二次元数据预测、二维组织靶标探索以及药物组合效应预测能力。
由于需要高度专业知识水平,因此暂时不会面向公众开放,而是计划2023年6月份开始向专业用户开放,让他们能够自主使用这些能力,在更多研究场景中调用AIprotein design 的力量,加速更多创新进展。
二.Biological Science Big Model xTrimo:预测速度快达AlphaFold标准,但准确率更高
为了充分吸收大量生物数据,我们需要将模型训练与工程技术融合起来。在这个过程中,每一次迭代都反馈至下一个环节,以便不断提升性能并接近实际应用需求。经过长期努力,xTrimo现在已经能够以比AlphaFold更快速度且更高准确率预测出各种复杂结构,这使得在AIGP上的每一步操作更加精确成功率也随之提高。此外,它还包括一系列针对具体任务参数预设,可以进一步调整以适应不同的研究需求。
做好这样一个强大的工具,不仅需要持续投入巨额资金,还必须不断融合前沿科技创新才能实现最大效益。而刘维CEO透露,他们每年的研发投资约为数千万美元,与传统方法相比,大幅缩减成本并显现出极大的效率潜力。他表示他们希望5年后能将AIGPin带到完全新的层次,就像OpenAI2018年的第一代GPT如何发展成为今天广为人知的地ChatGPT一样寻求相同程度突破变化他指出了未来的可能性:“我们今天还很弱小。”
结语:
AI正在推开生活科技领域的大门,从简单的人工智能控制系统转变为真正参与实验室工作流程中的角色。这改变着我们的研究方式,让我们能够利用数据处理与演绎来发现新的可能性。如果董晨院士的话不虚,那么这只是起步,有望见证未来革命性的变化。一路上,他们期待着加入更多伙伴共享这一旅程,一同开启无限可能。当你的想象触摸边缘,你会发现世界另一侧隐藏着什么?