Eleven v3 Eleven v3是ElevenLabs推出的先进文本转语音模型,支持情感和语调的精确控制,通过内联音频标签实现多样化的表达。它支持多说话人对话,能模拟真实交谈中的语气变化,覆盖超70种语言,适用于媒体影视配音、有声读物制作、游戏开发和教育等领域,提供生动、真实的声音体验。 AI项目与工具 2025年06月11日 65 点赞 0 评论 250 浏览
MultiTalk MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示,生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题,并采用部分参数训练和多任务训练策略,保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及 AI项目与工具 2025年06月11日 11 点赞 0 评论 169 浏览
Talefy Ai AI互动故事生成器,Talefy Ai能够帮助用户轻松创作各种类型的互动故事,将脑海中的故事具象化,并提供沉浸式的故事体验。 生活创意 2025年06月05日 89 点赞 0 评论 494 浏览
cnChar 一个功能全面、多端支持的汉字拼音笔画JavaScript库,用于处理汉字相关的多种功能,包括拼音、笔画、简繁体转换等。 字体字库 2025年06月05日 95 点赞 0 评论 312 浏览
PPTalker 一款专门将PPT演示文稿转换成高质量视频的在线工具,通过多语言的AI语音解说和字幕,用户可以在几分钟内将PPT生成高质量的视频。 PPT资源 2025年06月05日 30 点赞 0 评论 121 浏览
火山方舟大模型 字节跳动旗下的火山引擎推出的大模型服务平台,主要面向企业提供模型训练、推理、评测、精调等全方位功能与服务,并重点支撑大模型生态。 Ai平台模型 2025年06月05日 98 点赞 0 评论 124 浏览
Resoomer 一款文档或内容分析和总结各种类型文档的AI工具。只需单击一下,Resoomer 就可识别并提炼文档中的重要核心概念和论点。 Ai办公效率 2025年06月05日 65 点赞 0 评论 148 浏览
Vispunk Video 一款极简、强大的免费 AI文生视频制作工具。Vispunk Motion可让您仅使用文字创建逼真的短视频。您可以使用它来制作短片或社交媒体视频。 Ai视频生成 2025年06月05日 87 点赞 0 评论 294 浏览
有道数字人 网易有道推出的一系列基于人工智能技术的虚拟人物形象,旨在提供智能化和个性化的服务。这些数字人支持多种功能,包括但不限于照片说话和唱歌、视频翻译、形象克隆、歌声合成以及大屏交互等。 Ai视频生成 2025年06月05日 44 点赞 0 评论 355 浏览