语音

瓦兔漫剪工厂

一款帮助漫剪达人制作漫剪视频的辅助软件,其中集成文字转语音、频文字提取、漫画对白遮挡,自动搭配画面转场、音效、背景音乐等众多漫画剪辑功能,是一款漫剪小白也能一键使用的漫剪神器。

Memo

Memo是一款将视频转换为翻译文本、字幕和笔记的工具。无论是YouTube、播客还是本地音频和视频文件,Memo都能轻松将其转换为文本并提炼精华。

Speechnotes

Speechnotes是一款基于AI的语音转文字工具,提供高精度语音识别、实时语音输入、语音命令支持、自动大写处理等功能,支持多平台操作(Chrome扩展、Android、iOS、API等)。它强调隐私保护,录音不经过人工处理且自动删除,适合快速转录、会议记录、写作、医疗记录等多种应用场景,是提升工作效率的理想选择。

VoiceDub

VoiceDub 是一款AI驱动的音频处理平台,支持人声替换、声音克隆、文本转语音及音频分离等功能,提供超过10,000种AI人声音色。用户可通过平台进行音乐创作、有声内容制作及个性化音频生成,适用于多种应用场景,如语言学习、娱乐互动等。

EzAudio

EzAudio是一款基于文本到音频(Text-to-Audio, T2A)生成模型,通过优化的扩散变换器架构和高效的数据训练策略,实现了快速生成高质量音频的功能。它支持多种应用场景,如音乐创作、影视后期制作、语音合成等,并具备高保真度和低资源消耗的特点。

蚂小财

蚂小财是一款由蚂蚁集团开发的AI金融助手,基于自主研发的大模型技术,为用户提供实时市场热点解读、个性化理财建议和复杂财报的图文解读等功能。支持语音控制和定制简报服务,连接多家专业金融机构,适用于日常理财咨询、投资决策支持和金融知识普及等多种场景。

MemenomeLM

MemenomeLM是Brainrot AI推出的AI工具,专为Z世代研究人员设计,可将PDF文档、笔记等资料转化为有趣且互动性强的视频内容。具备多模态理解能力,能用简单语言解释复杂概念并提供现实例子,支持生成多种格式的短视频,如Brainrot Quiz、Yap Dollar等,还可添加搞笑音效、生成图片及选择不同语音。

Nova A.I.

一款简单却强大的在线视频编辑和日志软件,由计算机视觉视频搜索引擎提供支持。

Lingvanex

一个全面的翻译工具,包括文本、语音、图片和文档翻译应用。它利用神经机器翻译技术提高生产力。

Hallo3

Hallo3是由复旦大学与百度联合开发的基于扩散变换器网络的肖像动画生成技术,能够生成多视角、动态且逼真的视频内容。其核心功能包括身份一致性保持、语音驱动动画、动态对象渲染和沉浸式背景生成。技术上采用预训练变换器模型,结合身份参考网络与音频条件机制,实现高质量视频生成。适用于游戏开发、影视制作、社交媒体及VR/AR等多个领域。