语音
Fish Agent
Fish Agent是一款集成了自动语音识别(ASR)与文本到语音(TTS)技术的端到端语音处理工具,能够直接实现语音到语音的转换,无需传统语义编码器/解码器。它支持多种语言,适用于语音转换、环境音频信息捕捉等场景,并基于深度学习技术优化了语音处理性能。Fish Agent可广泛应用于内容创作、教育、客户服务及娱乐等领域。
AutoShorts
AutoShorts是一个开源的AI视频创作和发布平台,它通过AI技术自动生成并定制视频内容,支持用户自定义脚本、配音和视觉效果。该平台可实现每日自动发布新视频到YouTube和TikTok,适用于内容创作者、社交媒体管理者、营销代理及教育机构。AutoShorts简化视频制作流程,提升工作效率,同时确保内容的独特性和创新性。
Gemini Live
Gemini Live是一款由谷歌开发的智能语音助手,拥有自然语言理解和多模态识别能力,支持语音、图像和视频交互。其主要功能包括自然语言对话、多模态识别、个性化语音选择、任务自动化以及智能打断和续接。此外,Gemini Live还与谷歌的原生应用深度集成,提升用户体验。目标用户包括商务人士、技术探索者、多语言用户、创意人士和老年人。