语音 - 智狐AI导航

VXlive

VXlive是一款以语音社交为核心的多功能应用，支持语音聊天、直播、1对1视频通话及AI互动功能。内置AI语音识别与语音日记，提供个性化互动体验，增强用户情感陪伴。语音挑战活动提升社交趣味性，适合各类用户拓展社交圈，尤其适合社交焦虑人群。应用注重互动性和社区氛围，打造轻松友好的社交环境。

AI项目与工具 2025年06月12日 78 点赞 0 评论 700 浏览

Dola

Dola是一款基于人工智能的日历助手，它允许用户通过多种方式（包括文字、语音和图片）与主要的即时通讯软件交互，以高效地创建和管理日程事件。Dola具备自然语言理解和日历同步功能，能够自动识别并添加日程，支持跨平台同步，并在事件开始前发送提醒。此外，它还提供群组管理功能，适合团队和组织使用。Dola简化了日程管理流程，提升了个人和团队的工作效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 700 浏览

FunClip

FunClip是一款由阿里巴巴达摩院通义实验室开发的开源、本地部署的视频剪辑工具。它主要通过自动化语音识别技术，帮助用户基于语音转文字的结果，选择特定文本片段或说话人进行视频剪辑。其特点包括高精度的中文ASR模型、热词定制化、说话人识别功能、Gradio交互界面，以及支持多段剪辑和自动生成SRT字幕文件。

AI项目与工具 2024年07月01日 55 点赞 0 评论 700 浏览

FilmAgent

FilmAgent是一款由哈尔滨工业大学（深圳）研发的虚拟电影制作工具，基于多智能体协作框架，实现从剧本创作到镜头拍摄的全流程自动化。支持剧本生成、多智能体协作、镜头规划、语音合成等功能，适用于创意视频制作、影视教学及虚拟场景应用。系统在Unity 3D环境中运行，提升电影制作效率与创意表达能力。

AI项目与工具 2025年06月12日 31 点赞 0 评论 697 浏览

PodAgent

PodAgent是一款由多所高校与企业联合开发的播客生成框架，采用多智能体协作机制，模拟真实脱口秀场景，自动生成高质量对话内容。系统具备声音匹配、语音合成与表现力增强功能，并提供多语言支持和完整播客结构生成能力。同时，PodAgent引入评估指标，确保内容的专业性与多样性，适用于媒体、教育、企业推广等多个领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 697 浏览

ShowBiz AI

ShowBiz AI是一款基于BlackEye多模态视听大模型的专业级AI视频创作平台，专注于文本转动画、全流程AI赋能以及多种视频编辑功能。它支持从文案生成到分镜脚本设计再到编辑工具的一站式服务，涵盖横屏转竖屏、慢动作生成、抠像、扩图、擦除、高光处理、语音转写及语音生成等功能，旨在提升视频制作效率并降低创作成本，同时激发创意灵感。

AI项目与工具 2025年06月12日 56 点赞 0 评论 697 浏览

SadTalker是一个由西安交通大学、腾讯AI实验室和蚂蚁集团合作开发的开源AI数字人项目。该工具利用单张人脸图像和语音音频，通过3D运动系数生成逼真的说话人脸动画。它通过ExpNet精确学习面部表情，PoseVAE合成不同风格的头部运动，并采用3D面部渲染技术，实现高质量、风格化的视频动画。SadTalker还具备多语言支持和多模态学习能力，适用于虚拟助手、视频制作、语言学习、社交媒体和教育等

AI项目与工具 2025年06月12日 71 点赞 0 评论 696 浏览