模型 - 智狐AI导航

Speech

Speech-02 是 MiniMax 推出的先进文本到语音模型，支持零样本语音克隆和高质量语音合成，具备多语言支持和情感控制功能。采用自回归 Transformer 和 Flow-VAE 架构提升语音自然度和相似度，适用于配音、有声读物、智能助手等多种场景。提供 HD 和 Turbo 两个版本，满足不同性能需求。

AI项目与工具 2025年06月11日 33 点赞 0 评论 590 浏览

MobileVD

MobileVD是Qualcomm AI Research团队开发的首个面向移动端优化的视频扩散模型，基于Stable Video Diffusion架构，通过降低帧分辨率、多尺度时间表示和剪枝技术，显著提升模型效率。其具备高效的去噪能力和低资源消耗，适用于短视频生成、视频编辑、游戏动画及互动视频等多种应用场景，为移动设备上的视频生成提供了强大支持。

AI项目与工具 2025年06月12日 61 点赞 0 评论 591 浏览

Mobile

Mobile-Agent 是一种具备移动能力的智能代理系统，能够跨设备执行任务并优化资源使用。基于多模态大语言模型和视觉感知技术，支持自动操作、自我规划与反思，适用于多应用协同、跨平台操作及纯视觉交互。其技术架构包含多个智能体协作机制，提升了移动设备任务处理的效率与灵活性。

AI项目与工具 2025年06月12日 18 点赞 0 评论 591 浏览

EMO2

EMO2是一种由阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术，通过音频输入和静态人像照片生成高质量、富有表现力的动态视频。其核心技术包括音频与手部动作的协同建模、扩散模型生成视频帧，以及高精度音频同步。该工具支持多样化动作生成，适用于虚拟现实、动画制作和跨语言内容创作等场景，具备自然流畅的视觉效果和丰富的应用场景。

AI项目与工具 2025年06月12日 62 点赞 0 评论 591 浏览

Deep Paint 3D

Deep Paint 3D是一个为 Blender 这个 3D 制作软件设计的插件。可以在 3D 中交互式地绘制 3D 模型并为其添加纹理。它使用可以直接刷涂或投影到 3D 模型和场景上的纹理或自然介质。

3D&游戏 2025年06月05日 100 点赞 0 评论 592 浏览

法唠AI

法唠AI是基于大语言模型开发的法律人工智能工具，专注于证券法与金融法律领域。提供法律问答、知识图谱构建、深度搜索、案件逻辑图绘制、股票信息查询、维权指导及文书生成等功能，支持个性化法律服务，助力用户高效获取法律解决方案。

AI项目与工具 2025年06月12日 87 点赞 0 评论 592 浏览

LaDeCo

LaDeCo是一款基于多模态模型的自动化图形设计工具，通过分层规划与逐步生成的方式，实现从多模态输入到高质量设计输出的转换。其核心功能涵盖层规划、层级设计生成、分辨率调整、元素填充及多样化设计输出，广泛适用于设计师、研究人员、评估人员及开发者等群体，助力提升设计效率与质量。

AI项目与工具 2025年06月12日 53 点赞 0 评论 592 浏览

MagicArticulate

MagicArticulate是由南洋理工大学与字节跳动Seed实验室联合开发的3D模型动画化工具，支持自动骨架生成、蒙皮权重预测及高质量动画输出。其基于自回归Transformer架构，结合Articulation-XL大规模数据集，实现对多样化3D模型的高效处理。适用于3D动画、游戏开发、VR/AR、工业设计等多个领域，显著提升动画制作效率与质量。

AI项目与工具 2025年06月12日 22 点赞 0 评论 593 浏览

AISmartCube

AISmartCube是一个低代码平台，专为简化AI工具开发与业务流程自动化设计。它支持无代码构建AI工具，集成多种功能节点（如LLMs、图像处理、数据抓取等），并提供AI助手及共享知识库服务。该平台适用于自动化工作流、客户服务、内容创作、市场分析以及个性化推荐等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 593 浏览

Audio2Photoreal

从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。

Ai开源项目 2025年06月05日 77 点赞 0 评论 593 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期