AI

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库,具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别,适用于语音助手、会议记录、实时字幕等场景,提供灵活的音频输入与预处理机制,便于开发者快速集成和扩展。

LipDub

LipDub是一款利用AI技术的多语言配音工具,可将视频实时翻译成27种语言,确保声音与口型同步。其核心功能包括实时录制与翻译、高质量翻译、多语言支持及便捷分享,适用于教育、商务、旅游及娱乐等多种场景,助力全球化的跨文化交流与内容传播。

Yoodli

Yoodli是一款利用AI技术辅助用户提升演讲技能的在线平台,由专业演讲者团队打造。它能够实时分析用户的口头表达、声音质量和肢体语言,并给予针对性建议,同时支持进度追踪和个人目标设定。主要功能涵盖语速评估、填充词检测、肢体语言解析以及定制化角色扮演练习,广泛应用于演讲培训、面试准备及销售沟通等领域,注重用户隐私保护。

Keevx

Keevx是一款专注于AI数字人视频创作的工具,主要面向海外中小企业和个人创作者。它提供AI智能脚本生成、翻译功能,搭配优质公共人像和模板,支持一键生成营销视频。用户可上传自有脚本,选择数字人形象和语音来制作视频,适用于电商产品展示、员工培训、社交媒体内容创作及品牌宣传等场景。

FlexiAct

FlexiAct是由清华大学与腾讯ARC实验室联合研发的动作迁移模型,可在空间结构差异较大的场景下实现精准动作迁移,并保持目标主体的外观一致性。其核心模块包括轻量级RefAdapter和频率感知动作提取(FAE),有效提升跨主体动作迁移的灵活性与准确性。该模型适用于影视、游戏、广告等多个领域,具有良好的应用前景。

Motion Prompting

Motion Prompting 是一种利用点轨迹表示的视频生成技术,支持对象控制、相机控制及物理现象模拟等功能。它通过将用户输入转化为详细的运动轨迹,结合预训练的视频扩散模型与控制网络,在保持灵活性的同时提高生成质量。这项技术广泛应用于电影制作、游戏开发、虚拟现实等领域,为用户提供了强大的交互式视频生成工具。 ---

DeepWiki MCP

DeepWiki MCP是Cognition Labs推出的远程服务器,基于开放标准的Model Context Protocol(MCP),为AI应用提供访问和搜索GitHub代码库文档的能力。它包含三个主要工具:获取文档主题列表、查看文档内容以及针对仓库提问获得AI回答。支持SSE和Streamable HTTP传输协议,确保信息实时性和准确性,适用于快速查询文档、技术问题解答、代码库结构概览

Mureka

Mureka是一款由昆仑万维开发的AI音乐创作平台,旨在为专业艺术家和音乐爱好者提供高效、稳定的音乐创作环境。用户可以输入歌词并添加参考音乐,通过平台提供的Style功能控制音乐风格,实现个性化音乐创作。平台支持音乐风格和旋律控制,以及对歌曲各部分的自由调整,如前奏、主歌、副歌等。生成的音乐具有高度稳定性和可控性,用户可将其展示和销售,获得经济收益。Mureka还支持多语言音乐创作,涵盖多种语言,

KindlePPT

KindlePPT是一款利用AI技术快速生成演示文稿、视频脚本、测验及论文的多功能工具。其核心功能包括智能演示文稿生成、视频脚本创作、论文辅助撰写以及测验设计,支持多语言操作与格式导出。凭借高效的自动化处理能力和灵活的编辑选项,KindlePPT成为教育、企业和个人创作者的理想选择。

Astria AI

Astria是一个利用生成AI创建定制图像的平台。Astria AI允许用户上传一组主题的图像,然后根据文本提示生成新图像。