Evo 2 是由美国弧形研究所、英伟达和斯坦福大学等机构联合开发的 DNA 语言模型,专注于基因组建模与设计。该模型基于 StripedHyena 2 架构构建,能够处理长达 100 万个碱基对的 DNA 序列,并在单核苷酸分辨率下进行分析。Evo 2 采用 OpenGenome2 数据集进行预训练,该数据集包含来自多个生命领域的 8.8 万亿个标记,支持长序列建模、DNA 序列生成及嵌入向量提取等功能。模型提供多种检查点,以满足不同研究需求。Evo 2 在生物医学、合成生物学等领域具有广泛应用潜力,为基因组学研究提供了高效且精准的工具。
发表评论 取消回复