近日,专注于蛋白质设计的人工智能公司ProFluent Bio宣布推出其最新的蛋白质生成基础模型套件——ProGen3。这一模型采用先进的稀疏生成语言模型架构,参数规模高达460亿,训练数据包括1.5万亿个氨基酸token,这些数据源自ProFluent精心整理的蛋白质图谱v1(PPA-1),该图谱包含34亿个全长蛋白质序列和1.1万亿个氨基酸token。
ProGen3不仅能够生成全新的蛋白质序列,还能够重新设计现有蛋白质的特定结构域,以提升其功能。这一能力使得ProGen3在抗体设计、基因编辑蛋白开发等领域展现出卓越性能,其设计出的新型抗体和基因编辑蛋白性能优于现有产品且不侵犯专利。此外,ProFluent计划公开部分DNA配方,以推动行业发展。 ProFluent Bio成立于2023年,由前Salesforce AI研究负责人Ali Madani创立。公司致力于通过大规模语言模型将人工智能应用于生物学领域,旨在简化蛋白质设计过程,提高效率并降低成本。此次推出的ProGen3是ProFluent继ProGen1和ProGen2之后的又一重大突破,标志着蛋白质设计新时代的到来。 ProFluent Bio的创始人Ali Madani表示:“ProGen3的推出再次证明了人工智能在生物学领域的巨大潜力。我们相信,通过不断优化和扩展我们的AI模型,未来将能够解决更多生物学、医学和环境问题。”。 关于ProFluent Bio ProFluent Bio是一家位于加州伯克利的初创公司,专注于利用人工智能技术设计和验证功能性新型蛋白质。公司通过深度学习模型学习“生物学语言”,以实现从“偶然发现”到“理性设计”的转变。目前,ProFluent正在利用其专有的大语言模型、数据集和计算平台推动蛋白质工程领域的革新。 |