模型 - 智狐AI导航

OminiControl

OminiControl是一款高效且参数节约的图像生成框架，专为扩散变换器模型设计，支持主题驱动和空间控制。通过增加少量参数，它能够生成高质量图像并保持主题一致性，适用于多种应用场景，包括艺术创作、游戏开发和广告设计等。其强大的多模态注意力机制和灵活的架构使其成为图像生成领域的创新工具。

AI项目与工具 2025年06月12日 94 点赞 0 评论 936 浏览

InspireMusic

InspireMusic是由阿里巴巴通义实验室开发的AI音乐生成工具，支持通过文字描述或音频提示生成多种风格的音乐作品。其核心技术包括音频 tokenizer、自回归 Transformer 模型、扩散模型（CFM）和 Vocoder，实现文本到音乐的转换、音乐续写及高质量音频输出。该工具支持长音频生成、多种采样率，并提供快速与高音质两种推理模式，适用于音乐创作、音频处理及个性化音乐生成等场景。

AI项目与工具 2025年06月12日 83 点赞 0 评论 937 浏览

HiDream

HiDream-I1是一款由HiDream.ai团队开发的开源AI图像生成模型，具备17亿参数，支持多种图像风格生成，包括真实、卡通和艺术风格。其在提示词理解、细节渲染和图像一致性方面表现出色，适用于艺术创作、商业设计、教育科研等领域。模型采用扩散模型和混合专家架构（MoE），并集成多种文本编码器，实现高质量与高效率的图像生成。项目已在GitHub和HuggingFace开源，便于研究与应用。

AI项目与工具 2025年06月12日 64 点赞 0 评论 937 浏览

Fineshare VoiceTrans

Fineshare VoiceTrans 是一款支持实时变声的 AI 工具，可将声音转换为多种角色或性别，保留原有情感与语调。提供丰富的音效库、声音实验室和预设声音包，适用于游戏、直播、配音等场景。用户可通过不同订阅计划获得无限使用权限和定制服务，提升创作与互动体验。

AI项目与工具 2025年06月12日 24 点赞 0 评论 937 浏览

TokenVerse

TokenVerse 是一种基于扩散模型的多概念图像生成工具，支持从单图或多图中解耦并组合视觉元素，如物体、材质、姿势等。通过优化调制空间，实现对复杂概念的局部控制，无需微调模型即可生成个性化图像，适用于创意设计、艺术创作和内容生成等多种场景。

AI项目与工具 2025年06月12日 38 点赞 0 评论 937 浏览

万智

万智是零一万物推出的企业级AI解决方案，支持快速部署大模型，兼容多种硬件和架构，具备本地化部署能力，保障数据安全。平台集成RAG、联网搜索等功能，提升企业决策效率，并提供模型微调工具以满足垂直领域需求。采用Rewrite和Rerank技术优化输出准确性，显著提升性能。

AI项目与工具 2025年06月12日 90 点赞 0 评论 938 浏览

Animate Anyone 2

Animate Anyone 2 是由阿里巴巴通义实验室开发的高保真角色动画生成技术，能基于输入图像和运动信号生成高质量、自然流畅的角色动画。通过环境感知、形状无关掩码策略、物体交互增强等技术，实现角色与环境的深度融合，提升动画的真实感与稳定性。支持复杂动作处理、多角色互动及跨身份动画生成，适用于影视、广告、VR/AR、游戏及教育等多个领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 938 浏览

Xiaomi MiMo

Xiaomi MiMo 是小米推出的推理型大模型，具备强大的数学推理与代码生成能力。通过预训练与后训练相结合，利用大量高价值语料及强化学习算法，在 7B 参数规模下实现超越更大模型的表现。支持多场景应用，包括教育、科研、软件开发等，已开源至 HuggingFace，便于开发者使用与研究。

AI项目与工具 2025年06月11日 95 点赞 0 评论 938 浏览

DAM

DAM-3B是英伟达开发的多模态大语言模型，专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域，生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络，有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理，适用于动态场景。模型基于Transformer架构，支持多模态输入，广泛应用于内容创作、智能交互及无障碍工具等领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 938 浏览

TransPixar

TransPixar是由多所高校及研究机构联合开发的开源文本到视频生成工具，基于扩散变换器（DiT）架构，支持生成包含透明度信息的RGBA视频。该技术通过alpha通道生成、LoRA微调和注意力机制优化，实现高质量、多样化的视频内容生成。适用于影视特效、广告制作、教育演示及虚拟现实等多个领域，为视觉内容创作提供高效解决方案。

AI项目与工具 2025年06月12日 17 点赞 0 评论 939 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期