语音

Fliki.ai

将文本变成带有 AI 语音的视频,在 2 分钟内使用逼真的声音从脚本或博客文章创建视频!

小饿

小饿是饿了么推出的AI语音助手,专为外卖骑手设计,支持语音交互完成接单、确认到店等操作,提升配送效率。具备权益提醒、天气预警、路线提示、订单热力图及收入预估等功能,覆盖多种配送场景,增强用户体验。已在多个城市上线,适用于蜂鸟众包APP用户。

Videco

Videco 是一款基于 AI 技术的视频生成平台,支持语音克隆、动态变量和互动元素集成,适用于销售与市场营销场景。平台可生成个性化视频内容,提升用户参与度和转化率,并支持与 CRM 和邮件工具的集成。提供多语言支持与数据分析功能,助力企业优化营销策略,提高效率。

FunASR

FunASR是一个由阿里巴巴达摩院开源的多功能语音识别工具包,涵盖语音识别(ASR)、语音活动检测(VAD)、标点恢复、说话人验证及分离等功能。它支持工业级模型的训练与微调,并提供预训练模型和易用接口,便于快速部署。新增的Whisper-large-v3-turbo模型进一步提升了其性能,广泛应用于智能助手、会议记录、客服系统和语音搜索等领域。

Timtalk

Timtalk是一款基于人工智能技术的英语口语学习工具,集成了文本和语音对话功能,提供即时反馈、语法检查、词汇扩展及语音识别服务。它能够模拟真实交流场景,满足不同水平用户的需求,并支持多平台使用。无论是日常对话、旅行场景还是专业领域如商务和学术交流,Timtalk都可作为高效的辅助工具。

Quin

Quin 是由知名思维导图产品Xmind推出的基于人类塔罗师语料库训练的AI 原生应用。与传统的塔罗牌应用不同,Quin 将 AI 的强大能力与古老的塔罗牌智慧相结合,将复杂的塔罗流程简化...

Avatar IV

Avatar IV 是 HeyGen 推出的 AI 数字人模型,支持用户通过上传照片和语音快速生成逼真视频。该工具基于音频驱动的表情引擎,能精准捕捉语音中的语调、节奏和情感,生成自然流畅的面部表情和动作。操作简单,无需专业技能,适用于多种角色形象,涵盖社交媒体、企业营销、在线教育等多个领域,是高效内容创作的理想选择。

CopyCopter

CopyCopter是一款基于AI技术的短视频生成工具,能够高效地将长篇文本转化为高质量的短视频内容。它具备自动脚本生成、多语言语音选择、图片生成、库存视频素材调用等功能,并支持视频编辑、社交媒体发布及品牌定制化服务,广泛应用于内容营销、社交媒体管理、教育及新闻媒体等领域,助力用户提升创作效率和作品吸引力。

CleanS2S

CleanS2S是一款流式语音到语音交互智能体原型,通过集成自动语音识别(ASR)、大型语言模型(LLM)、文本到语音(TTS)以及WebSockets等技术,提供高质量、实时的语音交互体验。它支持全双工交互和打断功能,可整合网络搜索和RAG模型以增强回答能力,适用于客户服务、智能家居控制、教育辅助、健康咨询及车载系统等多个领域。

DreamActor

DreamActor-M1是字节跳动推出的AI图像动画框架,能够将静态照片转化为高质量动态视频。其核心在于混合引导机制,结合隐式面部表示、3D头球和身体骨架,实现对表情和动作的精准控制。支持多语言语音驱动、口型同步、灵活运动转移及多样化风格适配,适用于虚拟角色创作、个性化动画生成、虚拟主播制作及创意广告等领域,具备高保真、强连贯性和广泛适用性。