音频 - 智狐AI导航

WorldSense

WorldSense是由小红书与上海交通大学联合开发的多模态基准测试工具，用于评估大型语言模型在现实场景中对视频、音频和文本的综合理解能力。该平台包含1662个同步视频、3172个问答对，覆盖8大领域及26类认知任务，强调音频与视频信息的紧密耦合。所有数据经专家标注并多重验证，确保准确性。适用于自动驾驶、智能教育、监控、客服及内容创作等多个领域，推动AI模型在多模态场景下的性能提升。

AI项目与工具 2025年06月12日 61 点赞 0 评论 528 浏览

Ondoku

Ondoku 是一款支持多语言的文字转语音工具，提供文本输入、图片文字提取及语音调整功能。用户可将文本或图片中的文字转换为自然语音，并下载为音频文件。适用于教育、娱乐、商务等多种场景，如课程讲解、有声书制作和视频配音，提升信息传播效率。

AI项目与工具 2025年06月12日 41 点赞 0 评论 529 浏览

VideoToWords AI

一款免费在线将视频和音频转录为文本的工具，轻松在浏览器中将视频转换为文本，添加字幕等。还提供在线编辑、多种格式导出功能。

Ai语音工具 2025年06月05日 25 点赞 0 评论 531 浏览

Stable Audio

由Stability.ai团队倾力打造的Stable Audio 2.0音频生成模型

创作工具 1970年01月01日 0 点赞 0 评论 531 浏览

VoiceDub

VoiceDub 是一款AI驱动的音频处理平台，支持人声替换、声音克隆、文本转语音及音频分离等功能，提供超过10,000种AI人声音色。用户可通过平台进行音乐创作、有声内容制作及个性化音频生成，适用于多种应用场景，如语言学习、娱乐互动等。

AI项目与工具 2025年06月12日 57 点赞 0 评论 532 浏览

AbletonMCP

AbletonMCP 是一个开源工具，通过模型上下文协议（MCP）将 Ableton Live 与 Claude AI 连接，实现音乐制作过程中的 AI 辅助。支持双向通信，允许用户通过 AI 创建和编辑 MIDI 与音频轨道、选择乐器和效果、控制播放等。技术上采用 JSON 协议和套接字通信，适用于音乐创作、实时制作、教学及音频后期处理等多种场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 532 浏览

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理，能够通过稀疏控制信号（如手动轨迹、面部关键点序列或音频）实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习，能够将多种控制信号组合使用，生成复杂的动画效果，并能生成较长的视频片段。 ---

AI项目与工具 2025年06月12日 22 点赞 0 评论 532 浏览

Remusic

13种音乐功能帮助用户探索音乐作品

创作工具 1970年01月01日 0 点赞 0 评论 532 浏览

熊猫字幕

一款专业的在线字幕网站，提供自动在线字幕生成，视频音频字幕生成，字幕制作，语音转字幕，语音自动生成字幕，字幕翻译，字幕格式转换等各种字幕功能。

字幕配音 2025年06月05日 80 点赞 0 评论 533 浏览

Melodisco

Melodisco 作为一个 AI 音乐播放器，为音乐爱好者提供了一个新颖的平台，让他们能够探索由 AI 创作的音乐世界。

创作工具 1970年01月01日 0 点赞 0 评论 533 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期