ORM - 智狐AI导航

CogView4

CogView4是一款由智谱推出的开源文生图模型，具有60亿参数，支持中英文输入与高分辨率图像生成。在DPG-Bench基准测试中表现优异，达到当前开源模型的领先水平。模型具备强大的语义理解能力，尤其在中文文字生成方面表现突出，适用于广告设计、教育、儿童绘本及电商等领域。其技术架构融合扩散模型与Transformer，并采用显存优化技术提升推理效率。

AI项目与工具 2025年06月12日 83 点赞 0 评论 736 浏览

MagicArticulate

MagicArticulate是由南洋理工大学与字节跳动Seed实验室联合开发的3D模型动画化工具，支持自动骨架生成、蒙皮权重预测及高质量动画输出。其基于自回归Transformer架构，结合Articulation-XL大规模数据集，实现对多样化3D模型的高效处理。适用于3D动画、游戏开发、VR/AR、工业设计等多个领域，显著提升动画制作效率与质量。

AI项目与工具 2025年06月12日 22 点赞 0 评论 471 浏览

腾讯混元T1

T1（Thinker）是腾讯混元推出的深度思考模型，支持逻辑推理与联网搜索，具备高速响应和长文本处理能力。采用Hybrid-Mamba-Transformer架构，提升推理效率与准确性。适用于教育、医疗、市场分析等多个领域，输出简洁、幻觉低，适合复杂指令处理和多任务场景。

AI项目与工具 2025年06月12日 68 点赞 0 评论 645 浏览

GENERator

GENERator是阿里云飞天实验室开发的生成式基因组基础模型，基于Transformer解码器架构，具备98k碱基对的上下文长度和120亿参数。它能生成具有生物学意义的DNA序列，应用于蛋白质家族设计、启动子优化、基因组分析及合成生物学等领域。模型通过大规模数据预训练，并经过生物学验证，展现出强大的序列生成与优化能力。

AI项目与工具 2025年06月12日 54 点赞 0 评论 531 浏览

KTransformers是一款由清华大学KVCache.AI团队与趋境科技联合开发的开源工具，用于提升大语言模型的推理性能并降低硬件门槛。它支持在24GB显卡上运行671B参数模型，利用MoE架构和异构计算策略实现高效推理，预处理速度达286 tokens/s，推理速度达14 tokens/s。项目提供灵活的模板框架，兼容多种模型，并通过量化和优化技术减少存储需求，适合个人、企业及研究场景使用。

AI项目与工具 2025年06月12日 21 点赞 0 评论 729 浏览

InspireMusic

InspireMusic是由阿里巴巴通义实验室开发的AI音乐生成工具，支持通过文字描述或音频提示生成多种风格的音乐作品。其核心技术包括音频 tokenizer、自回归 Transformer 模型、扩散模型（CFM）和 Vocoder，实现文本到音乐的转换、音乐续写及高质量音频输出。该工具支持长音频生成、多种采样率，并提供快速与高音质两种推理模式，适用于音乐创作、音频处理及个性化音乐生成等场景。

AI项目与工具 2025年06月12日 83 点赞 0 评论 807 浏览

Lumina

Lumina-Image 2.0 是一款开源图像生成模型，基于扩散模型与 Transformer 架构，具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像，支持中英文提示词，并具备强大的复杂提示理解能力。模型支持多种推理求解器，适用于艺术创作、摄影风格图像生成及逻辑推理场景，兼具高效性和灵活性。

AI项目与工具 2025年06月12日 27 点赞 0 评论 756 浏览

Fast3R

Fast3R是一种基于Transformer架构的高效多视图3D重建方法，可在单次前向传播中处理上千张图像，大幅提高重建效率并减少误差累积。支持多视图并行处理，具备高精度、强可扩展性和快速推理能力，适用于机器人视觉、增强现实、虚拟现实、文化遗产保护及自动驾驶等多个场景。

AI项目与工具 2025年06月12日 86 点赞 0 评论 507 浏览

H

H-Optimus-0是由法国公司Bioptimus推出的全球最大的开源病理学AI基础模型，拥有11亿参数，基于超过50万张组织病理学切片训练，涵盖多种人体组织。该模型在癌症识别、基因异常检测、组织分类及生存分析等方面表现优异，具备强大的特征提取能力。作为开源工具，H-Optimus-0可促进病理研究与临床应用的协同创新。

AI项目与工具 2025年06月12日 75 点赞 0 评论 536 浏览

Video Alchemist

Video Alchemist是一款由Snap公司研发的视频生成模型，支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块，通过文本提示和参考图像生成视频内容，无需测试优化。模型引入自动数据构建和图像增强技术，提升主体识别能力。同时，研究团队提出MSRVTT-Personalization基准，用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧

AI项目与工具 2025年06月12日 26 点赞 0 评论 559 浏览

ORM

首页

ORM

列表

默认

浏览次数

发布日期