PlayHT PlayHT是一个功能强大、特性丰富的在线文本到语音工作室,它通过先进的AI技术,提供了一个广泛的、自然声音的AI语音库,适用于多种语言和场景。 创作工具 1970年01月01日 0 点赞 0 评论 286 浏览
VideoPoet VideoPoet是一款基于大模型的AI视频生成工具,支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计,能够处理和转换不同类型的输入信号,无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应 AI项目与工具 2024年01月01日 98 点赞 0 评论 283 浏览
Eleven v3 Eleven v3是ElevenLabs推出的先进文本转语音模型,支持情感和语调的精确控制,通过内联音频标签实现多样化的表达。它支持多说话人对话,能模拟真实交谈中的语气变化,覆盖超70种语言,适用于媒体影视配音、有声读物制作、游戏开发和教育等领域,提供生动、真实的声音体验。 AI项目与工具 2025年06月11日 65 点赞 0 评论 282 浏览
Brev AI Brev AI 是一款基于 AI 的在线音乐生成工具,能够将文本描述转化为定制化的音乐作品。它支持多种音乐风格,涵盖旋律、和声及完整曲目生成,并具备强大的自定义功能。凭借其高质量音频输出和广泛适用性,Brev AI 可应用于视频、社交媒体、播客等领域,满足不同用户的创作需求。 AI项目与工具 2025年06月12日 49 点赞 0 评论 282 浏览
Coral AI Coral AI 是一款基于 AI 的文档分析平台,专注于智能搜索、摘要生成、翻译及问答功能。它支持超过 90 种语言,适用于学术研究、法律分析和商业报告等场景,特别适合处理大量文档。主要功能包括智能搜索、自动摘要生成、实时翻译、引用生成、跨文档搜索、文档标记与管理等,并支持多种文件类型和图像分析。 AI项目与工具 2025年06月12日 54 点赞 0 评论 280 浏览
Seaweed Seaweed-7B 是一款由字节跳动开发的视频生成模型,拥有约 70 亿参数,支持从文本、图像或音频生成高质量视频。具备文本到视频、图像到视频、音频驱动生成、长镜头、连贯叙事、实时生成等功能,适用于内容创作、教育、广告等多个领域。采用变分自编码器和扩散变换器技术,结合多阶段训练与优化策略,提升生成效率与质量,兼顾性能与成本效益。 AI项目与工具 2025年06月11日 80 点赞 0 评论 278 浏览
EchoMimicV2 EchoMimicV2是一款由阿里巴巴蚂蚁集团研发的AI数字人动画生成工具,能够基于参考图片、音频剪辑及手部姿势序列生成高质量的半身动画视频。它支持多语言(中英双语)输入,并通过音频-姿势动态协调、头部局部注意力及特定阶段去噪损失等技术手段显著提高了动画的真实度与细节表现力,适用于虚拟主播、在线教育、娱乐游戏等多个领域。 AI项目与工具 2025年06月12日 17 点赞 0 评论 275 浏览