RecordScreen 一款不需要安装的浏览器在线屏幕录制工具,用户可以直接通过浏览器录制屏幕。它支持录制整个屏幕、浏览器窗口或特定标签页,并可选择同步录制摄像头画面。 直播录屏 2025年06月05日 83 点赞 0 评论 273 浏览
OBSRec录屏大师 一款简单、易用、专业的视频录制工具,支持录制屏幕、区域录制、窗口录制、声音录制、摄像头录制,满足用户在不同场景下的录屏需求。 直播录屏 2025年06月05日 10 点赞 0 评论 251 浏览
MultiTalk MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示,生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题,并采用部分参数训练和多任务训练策略,保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及 AI项目与工具 2025年06月11日 11 点赞 0 评论 172 浏览
Playmate Playmate是由广州趣丸科技开发的人脸动画生成框架,基于3D隐式空间引导扩散模型和双阶段训练框架,能够根据音频和指令精准控制人物表情和头部姿态,生成高质量动态肖像视频。其支持情感控制、姿态控制和独立控制,可生成多种风格的动态肖像,适用于影视制作、游戏开发、虚拟现实、互动媒体及教育等多个领域。 AI项目与工具 2025年06月11日 88 点赞 0 评论 477 浏览
Eleven v3 Eleven v3是ElevenLabs推出的先进文本转语音模型,支持情感和语调的精确控制,通过内联音频标签实现多样化的表达。它支持多说话人对话,能模拟真实交谈中的语气变化,覆盖超70种语言,适用于媒体影视配音、有声读物制作、游戏开发和教育等领域,提供生动、真实的声音体验。 AI项目与工具 2025年06月11日 65 点赞 0 评论 252 浏览
MoonCast MoonCast 是一个零样本播客生成系统,能够从纯文本源合成自然的播客风格语音。它采用长上下文语言模型和大规模语音数据训练,支持中文和英文,生成几分钟长的高质量播客音频。MoonCast 通过特定的LLM提示生成播客脚本,并利用语音合成模块转换为最终音频,具备长音频生成、增强自然性、多语言支持和零样本语音合成等功能。其技术原理包括多阶段训练、短段级别自回归音频重建和自发性增强,适用于内容创作、教 AI项目与工具 2025年06月11日 63 点赞 0 评论 183 浏览