音频

Resona V2A

专注于将视频内容自动转化为高质量音频。Resona V2A通过分析视频中的视觉元素,Resona V2A 能够生成与视频内容相匹配的声音设计、音效和环境音。

Particle News

Particle News是一款以AI驱动的新闻阅读平台,通过聚合多源信息,为用户提供个性化、简洁的新闻摘要与多视角报道。其核心功能包括个性化订阅、多样化新闻风格展示、互动问答及音频新闻服务,旨在帮助用户高效获取全面、客观的信息。适用于通勤、学习、工作等多种场景,适合各类用户群体。

BuboGPT | 字节大模型

BuboGPT是由字节跳动开发的大型语言模型,能够处理多模态输入,包括文本、图像和音频,并具有将其响应与视觉对象相对应的独特能力。

Buzz

Buzz是一款基于OpenAI Whisper模型的离线语音转文字工具,支持实时语音转文字和音频视频文件转录。它具备多语言识别和翻译功能,支持多种格式导出,并能在本地离线操作以保护用户隐私。主要应用于视频字幕制作、采访记录整理、语言学习辅助、会议记录和学术研究等场景。

FineShare Singify

Singify 作为一个 AI 驱动的歌曲翻唱生成器,为用户提供了一个创新的方式来重新演绎和享受音乐。

OmMuse

OmMuse 是一个面向音乐家和制作人的在线音乐创作平台,它提供了一系列的工具和资源来帮助用户创作和制作音乐。

Speech Studio

Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发...

Audo Studio

Audo AI为创作者和开发人员提供噪声消除产品,包括Audo Studio、Audo API和用于Linux的Magic Mic。这些产品利用音频处理和人工智能的最新进展,自动去除背景噪音,增强音频录制,...

Musico

Musico 是一个人工智能驱动的软件引擎,可以生成音乐。 它可以对手势、动作、代码或其他声音做出反应。

EDTalk

EDTalk是一款基于音频驱动的唇部同步模型,支持嘴型、头部姿态及情感表情的独立操控。用户可通过上传图片、音频和参考视频生成具有唇形同步和情感表达的动态人脸视频,广泛应用于教育、影视后期、虚拟现实等领域。其高效解耦机制和轻量化设计使其易于操作且资源友好。