NVIDIA · 大模型
NVIDIA 发布 Evo 2 生物分子基础模型
NVIDIA 联合非营利机构在 DGX Cloud 上训练并发布了 Evo 2,这是目前最大的公开基因组 AI 模型,能够理解所有生命域的遗传密码。Evo 2 通过 BioNeMo 平台开放给全球科学家,可用于基因序列分析、突变预测和蛋白质设计等生物分子研究任务。
- 域名
blogs.nvidia.com- 评分
- 5 · 重大发布
- 发布
- 2025-02-19
导读
NVIDIA 发布 Evo 2 生物分子基础模型,覆盖 DNA、RNA、蛋白质三种生物大分子的统一表征。 Evo 系列是 NVIDIA 与 Arc Institute 合作的项目,Evo 1 已是 ICML 2024 上最受关注的开 源生物 AI 模型之一,Evo 2 在数据规模、模型规模、跨域任务上做了大幅扩展。
Evo 2 训练数据涵盖 9.3 万亿核苷酸,跨越古菌、细菌、真核生物完整谱系,参数量达到 40B,能在零样本设定下完成基因功能预测、变异致病性评估、蛋白质设计、CRISPR sgRNA 优化等任务。和 AlphaFold 系列聚焦蛋白结构不同,Evo 2 处理的是"序列层"的生物语言。
模型权重在 HuggingFace 开放下载,配套的 BioNeMo 框架提供推理与微调工具。生物 AI 创 业公司和学术实验室可以直接基于 Evo 2 做下游任务,无需从头训练。NVIDIA 用 Evo 2 把 生物领域纳入了 CUDA 生态的覆盖范围。
原文摘要
Scientists everywhere can now access Evo 2, a powerful new foundation model that understands the genetic code for all domains of life. Unveiled today as the largest publicly available AI model for genomic data, it was built on the NVIDIA DGX Cloud platform in a collaboration led by nonprofit biomed…
