当大模型时代到来,如何借助 AI 驱动生命科学与医药创新

AI驱动的生命科学与医药创新

近年来,利用AI技术驱动业务创新与发展已经成为行业共识。2021年,DeepMind发布了AlphaFold2,凭借自身在蛋白质结构预测上的高可信度,以及远优于传统实验方法的效率和成本表现,树立起一座“AI for Science”的全新里程碑。AlphaFold2不仅在生命科学领域掀起了颠覆式的革新,也成为了AI在生物学、医学和药学等领域落地的核心发力点。

那么,当大模型时代到来,Al辅助的生命科学研究和制药将迎来哪些变化?AlphaFold2是否还是制胜的法宝?它如何在英特尔® 架构的CPU和加速器平台上实现显著性能优化?

潞晨科技创始人兼董事长,NUS校长青年教授尤洋、英特尔人工智能架构师杨威和百图生科AI算法负责人、资深总监王太峰三位专家,围绕《AI驱动的生命科学与医药创新》这一主题进行了精彩的分享。

当大模型时代到来,如何借助 AI 驱动生命科学与医药创新

AI 大模型驱动生命科学与制药创新,提速降本成为关键

“用 AI 大模型驱动生命科学与制药创新的关键在于降低模型训练成本,提高训练效率。”

尤洋在主题为《AI 大模型驱动的生命科学与医药创新》的分享中指出,过去六年大模型参数量每18个月增长了40倍,过去三年每18月增长了340倍,而硬件的增长速度大概每18个月增长1.7倍,已经完全跟不上节奏。

而训练世界顶尖AI大模型成本高、周期长,因此降低成本,提高效率,成为摆在生命科学与医药行业面前最大的挑战。

当大模型时代到来,如何借助 AI 驱动生命科学与医药创新

潞晨科技开发了Colossal-AI系统,包括高效内存管理系统、N维并行系统和低延迟推理系统,三位一体地帮助用户降低训练成本,提高训练效率。

作为当下最火热的开源AI大模型解决方案之一,Colossal-AI已收获Github Star七千多颗,此前在Stable Diffusion、GPT-3、AlphaFold等大模型上也展现出了卓越的性能优势。

潞晨科技与英特尔的合作,正是关于蛋白质结构预测方案的优化。

优化方案充分利用了Colossal-AI的大模型优化能力,使用英特尔® 至强® 可扩展处理器进行数据预处理,并用英特尔AI专用加速芯片Habana® Gaudi® 加速了AlphaFold2模型推理的执行。相比于之前应用的方案,AlphaFold2端到端推理速度最高提3.86倍,相较GPU方案,应用成本最多降低39%!

尤洋还表示,对于超长序列蛋白质结构的推理,通过引入至强® 可扩展处理器,发挥其内置加速硬件在AI推理上的优势,也能取得十分卓越的效果。

大幅优化 AlphaFold2 的性能,第四代英特尔®至强® 可扩展平台解读

面对大模型时代到来,Al 辅助的生命科学研究和制药将迎来新变化,英特尔® 至强® 可扩展平台能否实现更进一步的性能优化?英特尔人工智能架构师杨威进行了详细的解读。

当大模型时代到来,如何借助 AI 驱动生命科学与医药创新

在2022年,英特尔以第三代至强® 可扩展平台为硬件基座,对AlphaFold2实施了端到端的高通量优化,累计通量提升可达优化前的23.11倍。

当大模型时代到来,如何借助 AI 驱动生命科学与医药创新

今年,英特尔采用第四代至强® 可扩展处理器对AphaFold2进行优化,在第三代的基础上使通量再获得高达3.02倍的提升。

AlphaFold2 是一个科学计算+AI 的混合计算管线,在计算过程中可以将它分成预处理、深度学习模型推理和后处理三个阶段。

基于第四代至强® 可扩展处理器的优化方案主要聚焦在预处理和模型推理两个层面,用五大步骤助AlphaFold2实现端到端优化,以多项针对AI工作负载的优化加速技术为AlphaFold2推理带来“推背感”。

具体的优化步骤和优化加速技术,欢迎大家注册观看本期《至强实战课》,或点击“阅读原文”链接获取白皮书。

面向未来,加速创新!持续探索AI在生命科学与医药上的新方向、新趋势、新挑战

大模型无疑是近来科技圈最火爆的技术之一,它在医药和生命科学领域大步发展,也在此领域中发挥着巨大的作用。

百图生科AI算法负责人、资深总监王太峰认为,在传统的制药领域去设计蛋白质,或者淘选有用的蛋白质,往往都是利用传统实验,受限于当前物种现存在的一些蛋白质。当需要为特定病种去设计更好的蛋白质药物的时候,往往需要跨越已有的限制去重新设计,或者从头去de novo这些蛋白。这就需要研究人员对于整个蛋白领域有非常完善的知识。

据介绍,通过大语言的模型,或者基于生物体的里面的这些自然语言(包括所有的蛋白质和氨基酸等等的序列),通过这些非常大规模的蛋白质数据,从中学习或理解到这些蛋白质内在的一些规律。基于这个规律从头去设计新的蛋白质,这就是生物大语言模型之所以需要存在的一个非常必要的原因。

今年,百图生科开放了AIGP(AI Generated Protein)平台,并正致力于借助此平台加速研发工作,降低研发成本,并使其成为一个即插即用的平台,让更多的药物设计公司能够复用这些平台的建设。


未来,是否还会有更多AI辅助的生命科学研究和制药领域的创新?是否还有更多算法可以在生命科学和医药创新领域里找到机遇和探索的空间?让我们拭目以待。

如果您对本文涉及的基于Habana® Gaudi® 与英特尔® 至强® 可扩展处理器对AlphaFold2进行端到端优化的技术细节感兴趣,如果您也想了解百图生科在AIGP领域的最新进展,英特尔《至强实战课》之《AI驱动的生命科学与医药创新》将为您带来更加全面且详细的真人讲解,欢迎大家扫描海报中的二维码注册收看;

点击“阅读原文”也可以了解更多英特尔® 至强® 可扩展平台对AlphaFold2的优化详情。

*本文系量子位获授权刊载,观点仅为作者所有。

原文链接:https://www.intel.cn/content/www/cn/zh/customer-spotlight/cases/cpu-acceleration-alphafold2-next-level-throughput.html?cid=soc&source=Wechat&article_id=4848

版权所有,未经授权不得以任何形式转载及使用,违者必究。