工具

KeySync

KeySync是一种高分辨率口型同步工具,由帝国理工学院和弗罗茨瓦夫大学联合开发。其采用两阶段生成框架,结合掩码策略和视频分割模型,实现音频与唇部动作的精准对齐。支持高清视频生成,具备遮挡处理、减少表情泄露等功能,在视觉质量、时间连贯性和同步精度上优于现有方法,适用于自动配音、虚拟形象、视频会议等多场景应用。

Peech AI

Peech 是一个生成式 AI 视频平台,可帮助您自动转录、编辑、重新利用和标记您的视频内容,可以将讲话内容转换为自动生成的视频。

ElevenLabs Flash

ElevenLabs Flash是一款专为对话型AI设计的低延迟语音合成模型,支持多种语言,能够以极短的延迟(75毫秒)生成高质量语音,广泛应用于虚拟助手、客户服务、语音播报、教育及娱乐等领域,为用户提供即时反馈和沉浸式体验。该工具以其高效性和灵活性成为超低延迟语音合成领域的领先解决方案。

Kbear AI

Kbear,专门提供AI绘画和AI对话服务,在KbearAI绘画平台上,您只需要输入描述或上传图片便可完成各类AI绘画和设计。

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统,支持中英文及2000+音色,能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能,提供Web界面和API接口,适用于有声读物、智能助手、教育、客服等场景,技术上支持高效部署与模型微调。

summarize.tech

Summarize.tech是一款利用AI技术生成长视频文字摘要的在线工具,可自动提取视频中的关键信息并提供定制化的摘要长度和时间戳标记。它支持多种语言和跨平台链接,适用于学习、研究、职场及娱乐等多个场景,帮助用户高效获取所需信息。

In3D

In3D把人变成逼真的化身,使用手机摄像头在一分钟内为您的元宇宙、游戏或应用程序创建逼真且可自定义的头像

Upheal

Upheal是一款面向心理健康专业人士的AI平台,提供自动化的进展记录和视频会话功能。它支持多种治疗形式和多语言环境,具备会话分析、笔记编辑和模板自定义等功能,并可与EHR系统集成。其灵活的定价方案适用于不同需求,助力治疗师提升工作效率,专注于核心治疗工作。

宣小二

宣小二是一款基于人工智能技术的媒体发稿平台,主要功能涵盖新闻发稿、自媒体发稿、短视频矩阵发布等。它还提供舆情监控、AI写作服务、数据分析系统及自媒体账号管理工具,帮助企业优化营销策略,提升品牌影响力,同时支持多平台协同推广。

Airtop

Airtop是一款AI浏览器自动化工具,基于低成本可扩展的云浏览器,让用户能轻松抓取和控制任何网站。其AI Agent能像人类一样登录浏览网页,支持OAuth、2FA和验证码解决。用户可通过自然语言指令引导浏览器完成任务,无需复杂脚本。Airtop提供实时人工干预功能,适用于数据抓取、自动化测试、内容生成、自动化营销等多种场景,帮助用户高效完成自动化任务。