模型 - 智狐AI导航

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架，允许用户通过文本提示生成包含多个事件的连贯视频，并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧，同时结合预训练的视频扩散变换器（DiT）和大型语言模型（LLM）的提示增强功能，进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域，为视频创作带来了创新性的解决方案。

AI项目与工具 2025年06月12日 42 点赞 0 评论 457 浏览

MobileVD

MobileVD是Qualcomm AI Research团队开发的首个面向移动端优化的视频扩散模型，基于Stable Video Diffusion架构，通过降低帧分辨率、多尺度时间表示和剪枝技术，显著提升模型效率。其具备高效的去噪能力和低资源消耗，适用于短视频生成、视频编辑、游戏动画及互动视频等多种应用场景，为移动设备上的视频生成提供了强大支持。

AI项目与工具 2025年06月12日 61 点赞 0 评论 458 浏览

硅基流动

SiliconCloud 是硅基流动推出的一站式大模型云服务平台。

创作工具 1970年01月01日 0 点赞 0 评论 458 浏览

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具，基于超10万小时播客数据训练，支持零样本语音合成与说话人适配，可在0.33秒内生成1秒音频，适合实时与长内容合成。支持本地部署与API调用，应用于播客、有声书、视频配音、AI角色及新闻播报等领域，兼具高效性与灵活性。

AI项目与工具 2025年06月11日 94 点赞 0 评论 458 浏览

LaDeCo

LaDeCo是一款基于多模态模型的自动化图形设计工具，通过分层规划与逐步生成的方式，实现从多模态输入到高质量设计输出的转换。其核心功能涵盖层规划、层级设计生成、分辨率调整、元素填充及多样化设计输出，广泛适用于设计师、研究人员、评估人员及开发者等群体，助力提升设计效率与质量。

AI项目与工具 2025年06月12日 53 点赞 0 评论 458 浏览

Uthana

Uthana是一款基于AI的3D角色动画生成平台，支持通过文字描述、参考视频或动作库快速生成逼真动画。其核心功能包括动作搜索、骨骼适配、风格迁移、API集成等，适用于游戏开发、影视制作、虚拟角色设计等多个领域。平台提供灵活的输出格式和编辑工具，帮助用户高效完成动画创作。

AI项目与工具 2025年06月12日 62 点赞 0 评论 458 浏览

讯飞星火X1

讯飞星火X1是科大讯飞推出的基于全国产算力平台训练的大型语言模型，具备深度推理和“慢思考”能力，适用于数学、代码、逻辑推理、文本生成等任务。支持快慢思考统一模型，部署简便，算力需求低。广泛应用于教育、医疗、健康管理等领域，提供精准的智能服务与解决方案。

AI项目与工具 2025年06月12日 99 点赞 0 评论 458 浏览

Chatterbox是Resemble AI推出的开源文本转语音（TTS）模型，基于0.5B规模的LLaMA架构，用超过50万小时精选音频训练。它支持零样本语音克隆，仅需5秒参考音频即可生成高度逼真的个性化语音，并具备情感夸张控制功能，可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力，延迟低至200毫秒以下，适用于交互式应用。此外，它采用安全水印技术防止滥用，适用于内容

AI项目与工具 2025年06月11日 55 点赞 0 评论 458 浏览

Granite 4.0 Tiny Preview

Granite 4.0 Tiny Preview是IBM推出的轻量级语言模型，具备高效计算能力和紧凑结构，支持在消费级GPU上运行多个长上下文任务。采用混合Mamba-2/Transformer架构，结合高效与精准优势，支持无位置编码（NoPE）处理128K tokens上下文。内存需求降低72%，推理时仅激活1B参数，适用于边缘设备部署、长文本分析及企业级应用开发，适合资源受限环境下的AI研究与

AI项目与工具 2025年06月11日 42 点赞 0 评论 459 浏览

GameGen

GameGen-O 是一款基于 Transformer 架构的AI工具，专注于开放世界游戏视频的生成。它具备角色生成、环境构建、动作模拟及交互式控制等功能，通过两阶段训练方法提升了生成质量和灵活性，可应用于游戏原型设计、场景生成及开发辅助等领域，有助于降低开发成本并提高创作效率。

AI项目与工具 2025年06月12日 17 点赞 0 评论 459 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期