数字经济时代下安腾超级计算机助力开启药物研发新模式

近日,最新一期《求是》杂志上刊发了国家数据局党组书记、局长刘烈宏的署名文章《加快构建全国一体化算力网,推动建设中国式现代化数字基座》,其中明确指出“数字经济时代,算力是新质生产力”,再次引发了全网关于推动算力基础设施化的议论热潮。

新质生产力是以科技创新为主导、实现关键性颠覆性技术突破而产生的生产力。在今年两会公布的政府工作报告中,2024年政府工作十大任务的第一项就是“大力推进现代化产业体系建设,加快发展新质生产力”。文章指出,“全球主要发达国家加快推进算力战略布局,纷纷抢占算力竞争制高点,以新材料、生物制药、基因技术、金融科技、深海空天等为代表的前沿科技和未来产业,都对算力基础设施提出了前所未有的需求。”在前述的时代发展背景下,通过加强国家的算力基础设施建设,无疑是加快发展新质生产力的重要抓手。

只不过,算力基础设施的建设不能只关注“量”的增长,而忽略了“质”的提升。如何定义算力的“质”当然可以有很多角度,如果单单从“算力是新质生产力的视角”出发,一般认为算力的“质”的高低,最终还要看它应用到具体产业后,能够在多大程度上推动产业的关键性颠覆性技术突破。如果仅仅看算力需求的增长,而不看算力的增长对于解决具体产业中遇到的实际问题的价值提升,那么讨论算力的“质”也只是空中楼阁。

那么具体来说,算力究竟应该如何在相关应用领域中发挥新质生产力的作用呢?以生物医药行业中的创新药产业来举例。生物医药是关系国计民生、经济发展和国家安全的战略性新兴产业,目前全球主要大国都在争相发力布局。今年国家政府工作报告也明确将创新药列为需要积极培育的新兴产业和未来产业。在这个以创新为主导的赛道里,无疑是加快形成新质生产力的重要阵地。

传统的新药研发兼具周期长、投资高、风险大的特点。据不完全统计,每一款创新药物从最早实验室阶段到最终上市平均需要10年以上时间和10亿美金以上的研发投入;并且可能导致药物研发失败的因素有很多,即便是通过了动物试验的候选药物,都有89%在人体临床试验阶段失败,可能1万个实验室的候选药物活性化合物里才能有1个走到最终成功上市。

2016年前后,一家来自美国的制药公司RelayTherapeutics在这样的“游戏规则”中走出了一条新的道路。作为一家成立不久的初创公司,Relay仅用18个月、不到1亿美金就确认了一款胆管癌治疗药物RLY-4008的结构,并且顺利进入了美国FDA的临床II期试验,极大程度地缩短了从药物发现到临床前研究近90%的投入时间和成本,并且根据Relay公开的临床数据,使用了推荐剂量RLY-4008的胆管癌患者的整体缓解率高达88.2%。受益于RLY-4008等药物管线研发的亮眼表现,Relay于2020年7月登陆纳斯达克,成为全球第二家上市AI药物研发公司。

通过公开资料深入研究Relay的新药研发技术路线,可以发现Relay有一套与许多传统药企都不太相同的研发思路,从研发早期的药物发现阶段就引入了生物计算的研究方法,借助高性能计算机的强大算力来对药物分子与靶点的结合进行计算模拟,从而极大减少了传统实验方法不管在时间还是研发投入上的试错成本。而为Relay提供高性能算力的是一款名为安腾的大规模并行超级计算机,安腾超级计算机是由位于纽约的D.E.ShawResearch设计并制造于2007年首次发布的,自2008年开始运行。与Frontier、神威·太湖之光这类通用型超级计算机不同,这款超级计算机是专门为蛋白质和其他生物大分子的分子动力学(MD)模拟打造的特殊用途系统。这种专业化的聚焦使得安腾超级计算机在生命科学研究和生物制药研发领域展现出显著优势。

之后在2013年和2021年,D.E.ShawResearch分别发布了安腾超级计算机的第2代和第3代的产品。数据显示,最新的安腾超级计算机执行分子动力学模拟的速度比现有通用超级计算机快1000倍以上。目前,世界上仅有的几台安腾超级计算机分别安置在匹兹堡超算中心和位于纽约市的D.E.Shaw研究所中。

安腾超级计算机的名字来源于有着为“显微镜之父“之称的安东·范·列文虎克(AntonvanLeeuwenhoek),因为他制作了高精度光学仪器,并首次利用这些仪器观察到各种各样的生物体和细胞类型。由于安腾超级计算机只专注分子动力学模拟加速做一件事,所以,其将软硬件算法进行特殊设计,使得运算效率获得了极大提升。据悉,超算安腾的计算效率比全球最强的超算Frontier还要快上近50倍。

概括来说,超级计算机拥有强大的数据存储容量和快速的数据处理速度,多用于尖端技术研究和国家高科技领域,主要广泛应用在气象预报与气候模拟、生命科学与生物医学、能源与环境研究、工程与材料科学、地球科学与地理信息以及金融与经济分析等多个领域。而由于安腾超级计算机专注于分子动力学模拟,主要应用于生物计算、特别是药物发现等领域,其应用相对狭窄,存在一定的局限性。

ASIC芯片针对特定应用进行了深度优化,如通过定制化数据通路和并行计算架构,能够在特定领域实现远超过通用CPU和GPU的计算速度和效率,并在处理特定任务时表现出更高的可靠性和保密性。与通用超级计算机不同,超算安腾的架构特别注重针对细粒度事件驱动的运算优化,并通过计算与通信的高效重叠来提升整体性能。为了充分利用硬件优势,D.E.Shaw研究所为其设计了专用的分子动力学模拟软件Desmond,与硬件紧密结合,以实现针对特定问题的高效计算。这样的软硬件一体化设计使得安腾超级计算机在进行分子动力学模拟加速上取得了显著的竞争优势。

安腾超级计算机由大量的应用专用集成电路(ASIC)组成,并通过一个专门设计的高速三维环状网络相互连接起来。在硬件上,它的芯片、主板、布线都由D.E.Shaw研究所特殊设计。通过特殊设计的专用芯片,尽可能减少数据的传输和运算,在芯片上分区域、分精度计算不同任务,突破制约分子模拟速度的瓶颈——原子间相互作用力的计算。与硬件相匹配的是软件,D.E.Shaw研究所也专门设计了适配安腾的动力学模拟软件Desmond。

安腾超级计算机的核心优势在于其使用的512个MD专用ASIC芯片,这些芯片经过深度定制,能够精确执行分子动力学模拟中最耗时和最频繁的计算任务,如计算分子间的力场相互作用。ASIC芯片的设计原理是,它具有针对性强的指令集架构(ISA),专门为执行分子模拟中的关键计算步骤如键力计算、快速傅里叶变换(FFT)以及积分等操作优化。这种专门化的处理器同时保持了一定程度的可编程性,允许灵活适应不同的力场模型和整合算法,即使未来物理模型有所更新也能应对。

对比GPU、超算等更多的是在为访存密集型任务做优化,安腾超级计算机则面临的是通讯密集型的并行计算问题。因此相比于传统的通用超级计算机架构,安腾超级计算机在设计时采取了不同的策略。安腾超级计算机主要是对蛋白质进行分子动力学模拟,需要记录当前每个分子的位置、运动状态等,之后利用分子动力学模拟计算这些分子之间相互影响的结果。在这样的情况下,每个节点需要承担的运算并不复杂,所以并不需要每个计算单元具有极其高强的计算能力,不是计算密集型任务,也不需要大规模数据的输入输出存,所以也不是访存密集型任务。因此在设计上,安腾超级计算机取消了其它并行计算硬件中十分常见的缓存,也就是不需要很大的存储空间。

此外,分子动力学模拟中,计算最为密集的部分特别是静电相互作用,由于它们是基于成熟且不太可能随力场模型进化而改变的基本物理原理,因此非常适合硬件加速。安腾超级计算机针对这部分计算做了特别优化。要想实现MD模拟的显著提速,光是加速其中的“核心循环”还不够,还需要对其他相关的计算任务进行同步加速。据统计,在通用处理器上运行的标准MD模拟中,计算静电和范德华力所耗费的时间占到了总体计算时间的约90%。依据阿姆达尔定律,即使这部分计算效率得到大幅提升,但如果其他未加速的计算部分维持现状,整个系统的最大加速比也只能达到10倍上限。因此,超算安腾特意划拨了相当一部分硅片面积用于加速那些诸如键力计算、约束条件计算、速度和位置更新等其他关键任务,并根据实际需求嵌入了可编程功能,以便灵活应对多种力场模型和积分方法的计算需求。

在通信层面,因为分子动力学模拟是一种计算密集型方法,通常需要大规模并行化,快速并行分子动力学模拟的实现就需要节点间通信的高带宽和低延迟。为提高通讯效率,安腾超级计算机做了一些特别的设计。例如,安腾超级计算机设计了独特的内存子系统,专门用于积累每个粒子所受的力,这样可以减少计算过程中必要的数据交换。为了进一步提高计算效率,安腾超级计算机采用了低延迟、高带宽的网络结构,不仅在单个ASIC芯片内部实现快速通信,而且在不同ASIC芯片之间也建立起了高效的互联网络。这个网络特别支持常见的MD通信模式,比如多播和稀疏数据结构的压缩传输,同时也支持协调式的“推送”式通信方式,即生产者主动将结果发送给消费者,无需消费者预先请求数据。此外,系统中还配备了一系列独立的直接内存访问(DMA)引擎,用于卸载计算单元的通信任务,使得通信和计算过程能更紧密地重叠执行,从而最大程度减少等待时间。

这样一来,Relay公司的研发团队并未完全依赖数据库训练AI模型,而是借助专门针对分子动力学模拟优化的安腾超级计算机,得以实时可视化蛋白质复杂的动态行为。通过模拟蛋白质随时间推移的运动状态,研究人员能够深入了解药物靶点的动态结构特征,进而设计出与这些靶点结合亲和力更强的小分子药物。同时,这种方式弥补了依赖于传统静态成像技术在揭示蛋白质动态功能上的局限,它为药物开发带来了更为直观且全面的视角。尽管传统的电子显微镜技术能够获取蛋白质的三维静态结构,但在解析诸如蛋白质折叠这类快速且连续的动态事件时,受限于只能呈现某一时刻的快照,要完整重建整个折叠过程,理论上需要连续拍摄海量的高分辨率照片,可能多达数十亿帧。即便如此,即使收集到了如此巨量的静态影像数据,也无法直接解读出折叠过程中的细微动态变化,特别是那些深藏于分子内部、不易观察到的微结构转变。另外,电子显微镜观测过程中对样品的物理扰动也可能影响对蛋白质真实动态行为的准确捕捉和理解。通过运用分子动力学模拟技术,则能够在一定程度上克服上述难题,助力药物研发人员在理论层面上更加精确地预测和设计药物分子与靶标蛋白的相互作用。

安腾超级计算机目前主要应用于生物计算、特别是药物发现等领域。它先后扶持了Schrödinger和Relay这两家超10亿美金市值的制药上市公司。美国AI制药公司RelayTherapeutics在安腾的算力支撑下,仅用了1年半、1亿美金,就确定了高选择性FGFR2抑制剂药物RLY-4008的结构,这款药物目前正在通过美国FDA临床二期,有望成为历史上最快从实验室走向市场的创新药之一。2017年成为跨境电商氨糖第一品牌(天猫国际、京东)的益节同样也加入到了AI药物研发。Relay在RLY-4008和其它几条管线上展现出的临床前研发效率,打破了长期统治制药圈的“双十”魔咒,即一款创新药从实验室走向市场至少需要10年、10亿美金以上的投入。

2020年3月27日,D.E.Shaw研究所公布了新冠病毒3CL蛋白酶的长达100微秒的MD模拟动画及数据,3CL蛋白酶被认为在病毒增殖和组装中发挥了重要作用,并且是新冠药物开发的热门靶点之一。超算安腾计算的3CL蛋白酶MD模拟结果,对于科学家和制药学家透彻理解新冠病毒增殖与组装的机理,从而开发针对性的3CL蛋白酶抑制剂提供了极其宝贵的研究基础。这100微秒的模拟结果,如果放到超算中心去计算,需要花费数年时间才能算完,数字经济时代下安腾超级计算机助力开启药物研发新模式但是安腾超级计算机作为一台针对分子动力学算法做了软硬件功能特化的MD专用超算,仅需要十几天就可以算完。随后的两年里,D.E.Shaw研究所更是陆续围绕新冠病毒公布了超过1000微秒的MD模拟结果,对新冠病毒的病理研究和药物研发起到了非常重大的作用。

此外,通过超算安腾进行药物研发也突破了通用超级计算机的计算效率。在安腾超级计算机出现之前,即使是最先进的通用超级计算机,尽管其峰值浮点运算速度可达到每秒十亿亿次(petaflops),但在处理像分子动力学模拟这样的复杂任务时,由于受到复杂算法的执行瓶颈、海量数据处理压力以及较低的计算效能制约,实际模拟效能显得颇为有限。例如,一台顶级的通用超级计算机,在进行分子动力学模拟时,每日可能仅能模拟出几纳秒至几十纳秒的分子运动过程。相比之下,生物体内的自然过程,如蛋白质折叠,其实际时间尺度通常在微秒级别以上,甚至可能达到毫秒级别。基于这种时间尺度的差距,若仅依赖于传统的计算资源来模拟一个完整的生物过程,例如从蛋白质初始折叠直至达到稳定状态的全过程,理论上可能需要耗费数年,甚至在极端情况下,可能需要几十上百年的时间才能完成一个详细的模拟研究。

安腾超级计算机的出现,极大推动了生物计算行业的发展。发明安腾超级计算机的D.E.Shaw研究所是一家在DavidE.Shaw博士科学领导下运营的计算生物化学研究公司。DavidE.Shaw博士是计算机领域顶尖的“天才”级人物。他是斯坦福大学计算机博士,不到30岁就进入哥伦比亚大学任教,并开展大规模并行计算研究。之后他投身华尔街,加入摩根士丹利,利用计算机技术进行量化交易。1988年,他创办了以自己名字命名的对冲基金D.E.Shaw&Co,因其在高频量化交易方面的先驱作用,在1996年被《财富》杂志称为“KingQuant”(量化投资之王)。在2001年,DavidE.Shaw博士成立了D.E.Shaw研究所。为研发出安腾超级计算机,D.E.ShawResearch招募了全球数百名数学、化学、生物学等专业以及计算机软硬件方面顶尖的理工博士。DavidE.Shaw本人2007年入选美国艺术和科学国家研究院,2009年成为奥巴马政府科学工程委员会委员,在2012年和2014年成为美国国家工程院院士和美国国家科学院院士。

常规情况下,即便是采用国际领先的超级计算机集群,要实现相同级别的模拟实验所耗费的时间可能会以年计。然而,得益于安腾超级计算机对分子动力学计算任务的高度优化能力,这项原本耗时冗长的任务在短短十几天内就被高效执行完毕。随后的两年里,D.E.Shaw研究所持续推进研究,陆续发布了累计超过1000微秒的新冠病毒分子动力学模拟研究成果,这些成果对深化新冠病毒病理学理解以及驱动相关治疗药物的研发工作产生了深远且持久的影响。

每一次显微镜技术的进步都是为了提高了人类对微观世界的观察能力和分辨率。借助冷冻电镜,结构生物学家们可拍出结构清晰可见的超高清蛋白质分子“照片”,进一步打开了微观世界的“视界”。但是,仅仅是“照片”能够捕捉的信息终究是有限的,例如,蛋白质的一次折叠,至少需要十亿张“照片”才能描述,这里面蕴含的海量动态信息,仅凭冷冻电镜的话,科学家是不可能彻底洞悉和掌握的。随着计算机技术的不断发展,上世纪八十年代以后,一种通过计算机直接模拟微观粒子运动过程的分子动力学模拟方法(MolecularDynamics,简称MD方法)逐渐开始得到了更广泛的应用。通过分子动力学模拟,可以直接看到蛋白质运动的动态“影片”。基于“蛋白质影片”的信息,科研工作者将更容易发现药物靶点口袋、设计易于结合的小分子等。

但一直以来,分子动力学模拟方法始终都因为严重的计算效率瓶颈,导致无法产业化应用。人体内典型的大分子蛋白质往往由几十万到上百万个原子构成,假设用分子动力学模拟方法计算一个50万原子的蛋白质运动0.001秒的“影片”,哪怕用上1000颗主流CPU并行计算,都需要耗费超过100年的时间。在这样的背景下,D.E.ShawResearch设计并研发出专门加速分子动力学算法的专用超级计算机——安腾超级计算机。

据了解,安腾超级计算机执行分子动力学(MD)模拟的速度比当时最快的通用超级计算机快100倍,其非凡的性能及其对科学和制药研究的重要贡献使其两度获得高性能计算领域的最高荣誉GordonBell奖。中国科学院院士、北京航空航天大学教授钱德沛在接受《中国科学报》采访时曾谈到,“美国D.E.Shaw研究所就用专门设计的ASIC芯片搭建了分子动力学模拟专用计算机安腾,通过算法创新和软硬件协同,在分子动力学模拟中获得了比通用计算机高出百倍的计算能效,这是非常值得大家借鉴的。

也许,在未来的AI制药领域,依托类似安腾这样的专用超级计算机,AI制药企业将得以在积极构建和完善自家数据库的同时,也能并行开展一系列高度复杂的计算密集型研发活动。通过这种双轨并进的方式,AI制药公司有望在优化药品研发流程、大幅缩短创新周期上取得显著成效,从而在科研突破和商业成功上取得传统医药公司难以企及的成就。

免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢!联系QQ:2760375052

分享:

扫一扫在手机阅读、分享本文