模型 - 智狐AI导航

YuE

YuE 是一款由香港科技大学与 Multimodal Art Projection 联合开发的开源 AI 音乐生成模型，支持多语言和多种音乐风格，如流行、金属、爵士、嘻哈等。通过语义增强音频分词器、双分词技术和三阶段训练方案，解决长上下文处理与音乐生成难题，生成结构连贯、旋律优美的歌曲。模型完全开源，用户可自由使用和定制，适用于音乐创作、影视配乐、游戏音效及社交媒体内容制作等多个场景。

AI项目与工具 2025年06月12日 23 点赞 0 评论 806 浏览

Motion Anything

Motion Anything 是一款由多所高校与企业联合研发的多模态运动生成框架，可基于文本、音乐或两者结合生成高质量人类运动。其核心在于基于注意力的掩码建模和跨模态对齐技术，实现对运动序列的精细控制与动态优先级调整。该工具支持影视动画、VR/AR、游戏开发、人机交互及教育等多个应用场景，并配套提供 Text-Music-Dance (TMD) 数据集，推动多模态运动生成技术的发展。

AI项目与工具 2025年06月12日 23 点赞 0 评论 806 浏览

OmniCam

OmniCam 是一种基于多模态输入的高级视频生成框架，结合大型语言模型与视频扩散模型，实现高质量、时空一致的视频内容生成。支持文本、视频或图像作为输入，精确控制摄像机运动轨迹，具备帧级操作、复合运动、速度调节等功能。采用三阶段训练策略提升生成效果，并引入 OmniTr 数据集增强模型性能。适用于影视、广告、教育及安防等多个领域，提高视频创作效率与质量。

AI项目与工具 2025年06月12日 18 点赞 0 评论 806 浏览

Pixel3DMM

Pixel3DMM是由慕尼黑工业大学、伦敦大学学院和Synthesia联合开发的单图像3D人脸重建框架，基于DINOv2模型，能从单张RGB图像中准确重建出3D人脸的几何结构。该工具擅长处理复杂表情和姿态，支持身份和表情的解耦，并通过FLAME模型优化实现高精度重建。其应用场景涵盖影视游戏、VR/AR、社交视频、医疗美容和学术研究。

AI项目与工具 2025年06月11日 88 点赞 0 评论 806 浏览

Together AI

Together AI 是一家提供生成式 AI 云服务的平台，支持模型快速推理、微调及训练，具备高性能、低成本和可扩展性。平台提供无服务器或专用端点部署，支持企业级 VPC，确保数据安全。其 GPU 集群支持大规模 AI 计算，适用于内容创作、企业应用、网络安全等多个领域，满足从模型优化到定制开发的全流程需求。

AI项目与工具 2025年06月12日 39 点赞 0 评论 806 浏览

Open Materials 2024

Open Materials 2024 (OMat24) 是Meta发布的开源数据集，包含超过1.1亿个无机材料的密度泛函理论（DFT）计算数据，并配备了预训练的图神经网络模型EquiformerV2。该模型在材料的基态稳定性及形成能预测方面具有卓越表现，为新材料的发现和设计提供了高效工具。其核心功能包括大规模数据集支持、高效的材料属性预测以及在多个领域（如能源、环境、催化等）的实际应用潜力。

AI项目与工具 2025年06月12日 39 点赞 0 评论 806 浏览