iMyFone VoxBox iMyFone VoxBox是一款集多种声音制作功能于一体的AI声音生成器,适合各种使用场景,从视频配音到有声书叙述,再到播客和游戏角色配音等。 Ai语音工具 1970年01月01日 0 点赞 0 评论 440 浏览
Ztalk.ai Ztalk.ai 是一款支持多语言实时语音翻译的AI桌面应用,具备低延迟、高清晰度和强兼容性,可与主流视频会议平台无缝连接。内置降噪、字幕及AI提示功能,确保沟通效率与质量。采用端到端加密,保障数据安全,适用于全球商务会议、跨境协作、客户互动及多语言培训等场景。 AI项目与工具 2025年06月11日 75 点赞 0 评论 438 浏览
Video Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积(STC)连接器和音频分支,显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。 AI项目与工具 2025年06月12日 50 点赞 0 评论 434 浏览
AutomateClips AutomateClips是一款人工智能视频生成器,专为社交媒体平台如TikTok、Instagram和YouTube设计,以自动化创建吸引人的视频内容。 Ai视频生成 1970年01月01日 0 点赞 0 评论 433 浏览
ecrett music Ecrett Music 是一个利用人工智能技术帮助用户高效创作免版税音乐的在线平台。它允许用户通过设定场景、情感及音乐类型等参数自动生成背景音乐,并提供多种编辑选项以满足个性化需求。同时,该平台还具备强大的音乐管理和匹配功能,适用于视频、游戏、播客等多个领域。 AI项目与工具 2025年06月12日 49 点赞 0 评论 432 浏览
PaddleSpeech PaddleSpeech是百度飞桨团队开发的开源语音处理工具,涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式,适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架,提供高效的深度学习模型和丰富的音频处理能力,适用于多种实际应用需求。 AI项目与工具 2025年06月12日 87 点赞 0 评论 427 浏览
Shotcut 一款适用于 Windows、Mac 和 Linux 的免费开源跨平台视频编辑器。Shotcut支持数百种音频和视频文件格式,并且无需导入即可进行本地编辑。 视频剪辑 2025年06月05日 37 点赞 0 评论 426 浏览
Loopy AI 字节跳动和浙江大学联合开发的音频驱动的AI视频生成模型,能够将静态图像转化为动态视频,实现音频与面部表情、头部动作的完美同步。 Ai视频生成 2025年06月05日 93 点赞 0 评论 424 浏览