语音

讯飞会议

科大讯飞推出的一款智能、高效、安全的云视频会议协作平台,为用户提供音视频清晰稳定流畅的音视频、多端协同、远程会议、AI降噪、实时多语种字幕、自动生成会议记录等功能。

Actor Mode

Actor Mode 是由 ElevenLabs 开发的 AI 语音生成工具,支持用户通过自身声音生成风格一致的语音内容。它具备多语言支持、语音属性调节、即时生成等功能,适用于有声读物、视频配音、虚拟助手等多个领域。用户可通过录制或上传音频,让 AI 提取语音特征并生成符合要求的语音输出,提高创作效率与个性化表达。

CopyCopter

CopyCopter是一款基于AI技术的短视频生成工具,能够高效地将长篇文本转化为高质量的短视频内容。它具备自动脚本生成、多语言语音选择、图片生成、库存视频素材调用等功能,并支持视频编辑、社交媒体发布及品牌定制化服务,广泛应用于内容营销、社交媒体管理、教育及新闻媒体等领域,助力用户提升创作效率和作品吸引力。

backseat ai

Backseat AI是一款面向《英雄联盟》玩家的AI语音辅助工具,提供实时游戏评论、购买建议、对线策略以及赛后分析等功能。它具有低资源占用、多语言支持和个性化语音包的特点,并与创作者共享收益,支持内容创作发展。

Sonic

Sonic是由腾讯与浙江大学联合开发的音频驱动肖像动画框架,基于音频信号生成逼真面部表情和动作。它通过上下文增强音频学习和运动解耦控制器,提升唇部同步精度与运动多样性。Sonic在长视频生成中表现出色,具备高稳定性与自然连贯性,支持用户自定义参数。适用于虚拟现实、影视制作、在线教育、游戏开发和社交媒体等多个领域。

知存科技

专注研发基于存算一体先进技术的人工智能芯片

Illuminate

Illuminate是一款基于谷歌Gemini语言模型开发的AI工具,可将学术论文转化为生动的音频讨论。它通过自然语言处理技术和文本到语音合成,生成包含核心观点的对话内容,支持用户在碎片化时间中高效学习。该工具具备动态音频转换、个性化学习体验、互动反馈及多平台共享等功能,适用于学术研究、学生辅助学习及非专业人士的知识普及。

Text

将文本转换成歌曲的工具。它使用自然语言处理将文本输入转换为音频组合。该工具允许用户从各种音乐风格和乐器中进行选择,以及调整节奏、键和动态等参数。生成的音轨可以导出为高...

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型,能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器(VAE)和因果Transformer架构,支持自回归生成与跨模态信息共享,特别擅长图像生成、多模态语言模型及文本到语音合成等任务,其提出的σ-VAE进一步提升了模型的鲁棒性。

Vizard录屏

免费高清的在线电脑录屏、剪辑软件,无需下载安装软件。