生成

Hedra

Hedra是由一批前斯坦福大学研究员组成的数字创新实验室推出的一款人工智能驱动的视频创作工具。它致力于将先进的AI技术运用到角色视频的创造过程中。用户只需提供一张照片和一段音...

灵犀 X2

灵犀 X2 是智元机器人推出的双足人形机器人,具备 28 个自由度和高灵活性,可完成跳舞、奔跑、骑车等复杂动作。搭载 Diffusion 动作生成引擎和多模态交互系统,支持情感识别与毫秒级响应。适用于家庭服务、教育、医疗护理、工业协作及娱乐场景,具备强大的环境感知与任务执行能力。

Text To Speech

构建自然说话的应用和服务,从 147 种语言和变体中选择 456 种语音

CSM 3D Viewer

CSM 3D Viewer提供api、接口和开源软件,将多模态输入和体验转换为数字模拟器,用于人工智能训练和内容创建。我们相信,学习生成世界模型是实现AGI的系统路径,类似于儿童从经验中...

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具,支持中英文双语及跨语言合成。它无需额外生成模型,通过LLM预测编码直接生成音频,实现零样本语音克隆。用户可自定义语音参数,如音色、语速等,适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

Mobius

Mobius 是一款基于人工智能的视频生成工具,能根据文本描述自动生成无缝循环的视频内容。其核心技术包括潜在循环技术和时间一致性优化,确保视频流畅自然。支持多场景应用,如社交媒体、广告、艺术创作和教育领域,简化视频制作流程,提升创作效率与质量。

Aligner

Aligner是由北京大学团队开发的大语言模型对齐工具,通过学习对齐答案与未对齐答案之间的差异来提升模型性能。采用自回归seq2seq结构,在Q-A-C数据集上训练,无需RLHF流程。具备高效、灵活、即插即用等特点,支持多模型兼容,提升模型帮助性和安全性。适用于多轮对话、价值观对齐及MoE架构优化等场景。

Magic Animate

Magic Animate是一项开创性的开源项目,简化了动画创作,允许您从单个图像和动态视频制作动画视频。

PipiGPT

通过AI技术自动识别图片内容并一键生成文案,发布在朋友圈、小红书等社交平台上。

Cassette

Cassette能帮助您立即创作出高品质的节拍。 凭借其先进的AI技术,Cassette可以生成与您的音乐视觉相匹配的独特节拍和节奏。 只要向人工智能模型描述你的节拍,应用程序就会完成剩...