国际顶级学术期刊《自然》旗下子刊《机器智能》发表了百度飞桨螺旋桨联合百图生科研发的文心生物计算大模型的又一重大成果《A method for multiple-sequence-alignment-free protein structure prediction using a protein language model》,提出了全球首个开源、并提供在线服务,无需MSA输入的蛋白结构预测大模型HelixFold-Single。
该项研究是百度在生物计算领域继HelixGEM和Linear Design两项重磅工作之后,在蛋白领域的又一突破性成果。该工作打破了AlphaFold2等主流依赖MSA检索模型的速度瓶颈,将蛋白结构预测速度平均提高数百倍,实现了秒级别预测,该工作的发表也为产学研各界带来了使用门槛更低、适用范围更广的蛋白结构预测解决方案,有望促进我国生命科学、生物医药、蛋白研究等领域的发展。
近年来,AI一直致力于突破蛋白质的结构预测问题,并在预测精度方面取得了重大进展。特别是 AlphaFold2将蛋白质预测推向了一个新的前沿。但问题在于,以 AlphaFold2 模型为代表的主流蛋白质结构预测方法严重依赖于多序列比对(MSAs, Multiple Sequence alignments)和模板(Templates)提取的协同进化信息。(李记)
来源:光明网