模型 - 智狐AI导航

Audimee

一款由AI驱动的音乐创作工具，专注于为音乐人和制作人提供创新的声乐处理功能。用户可以使用Audimee将自己的声乐转换为免版税的声音，甚至可以训练自己的声音模型。

Ai语音工具 2025年06月05日 98 点赞 0 评论 2072 浏览

心辰Lingo语音大模型

实现了从语音输入到语音输出的全程无缝对接，心辰Lingo能够直接理解语音内容，捕捉语气、节奏和情绪，并以同样丰富的语音形式进行回复。

Ai平台模型 2025年06月05日 84 点赞 0 评论 1800 浏览

GeneralDyG

GeneralDyG是一种由南洋理工大学提出的通用动态图异常检测方法，适用于社交网络、电商、网络安全和金融等领域。该工具通过时间 ego-graph 采样、图神经网络和时间感知 Transformer 模块，有效捕捉动态图的多尺度特征，具备高适应性和计算效率。实验证明其性能优于多种主流方法，具有广泛的应用前景。

AI项目与工具 2025年06月12日 95 点赞 0 评论 1471 浏览

像塑

抖音AR特效开放平台，通过像塑抖音，您可以组合不同的素材与能力来构建可应用于人脸、身体或场景的炫酷趣味AR视效。

视频剪辑 2025年06月05日 68 点赞 0 评论 1460 浏览

VILA

VILA-U 是一款由 MIT 汉实验室开发的统一基础模型，整合了视频、图像和语言的理解与生成能力。它通过自回归框架简化模型结构，支持视觉理解、视觉生成、多模态学习和零样本学习等功能。VILA-U 在预训练阶段采用混合数据集，利用残差向量量化和深度变换器提升表示能力，适用于图像生成、内容创作辅助、自动化设计、教育和残障人士辅助等多种场景。

AI项目与工具 2025年06月12日 40 点赞 0 评论 1445 浏览

PixelDance

字节跳动研发的一种视频生成模型，PixelDance通过结合文本指导和首尾帧图片指导的方式，能够生成具有复杂场景与动作的视频。

Ai平台模型 2025年06月05日 44 点赞 0 评论 1433 浏览

AutoCoder

AutoCoder是一款基于AI技术的自动编程工具，利用大模型和PLE架构实现端到端代码生成。它支持非技术背景用户通过自然语言描述需求生成软件应用，并具备快速原型制作、功能迭代及全生命周期管理能力，适用于快速原型开发、个性化软件生成及教育等多个领域。 ---

AI项目与工具 2025年06月12日 14 点赞 0 评论 1401 浏览

MLE-Agent是一款面向机器学习工程师和研究人员的智能助手，具备自动化基线创建、智能调试、文件系统集成、工具集成和交互式命令行界面等功能。它通过集成大型语言模型（LLM）、自动化机器学习（AutoML）、代码生成和检索（Code Generation and Retrieval）以及智能调试（Smart Debugging）等技术，提供无缝的AI工程和研究体验。MLE-Agent支持与多个AI

AI项目与工具 2025年06月12日 15 点赞 0 评论 1256 浏览

Custom

Custom-SVG 是一种基于文本提示生成定制风格 SVG 图形的框架，结合前馈模型与扩散模型的优势，实现结构规整且风格统一的矢量图形生成。支持风格定制、语义对齐和高效生成，适用于图形设计、UI 设计、网页设计及教育等多个领域。其核心技术包括路径级表示的扩散模型训练和基于图像扩散先验的风格迁移。

AI项目与工具 2025年06月11日 62 点赞 0 评论 1195 浏览

Parler

Parler-TTS是一款由Hugging Face开发的开源文本到语音（TTS）模型，能够模仿特定说话者的风格，生成高质量、自然的语音。该模型采用轻量级设计，包括文本编码器、解码器和音频编解码器，通过整合文本描述和嵌入层，优化了语音生成过程。Parler-TTS的所有资源公开，促进了高质量、可控TTS模型的发展。此外，用户还可以根据需要对模型进行自定义训练和微调。

AI项目与工具 2024年01月01日 91 点赞 0 评论 1173 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期