同步

MMAudio

MMAudio是一款基于多模态联合训练的音频合成工具,通过深度学习技术实现视频到音频、文本到音频的精准转换。它具备强大的同步模块,确保生成的音频与视频帧或文本描述时间轴完全对应,适用于影视制作、游戏开发、虚拟现实等多种场景,极大提升了跨模态数据处理的能力和应用效率。

小卡健康

小卡健康是一款由北京快欧科技推出的AI健康管理应用,主要功能包括通过拍照识别食物热量和营养成分,自动记录饮食数据,并根据用户健康目标生成个性化热量摄入建议。应用还提供AI智能助手、个性化食谱推荐、轻断食追踪等功能,支持多平台同步,帮助用户科学管理饮食与健康。

Linly

一款开源的多语言AI配音和视频翻译工具。Linly-Dubbing可以自动将视频翻译成其他语言并生成字幕、克隆视频中说话者的声音并自动配音、进行口型同步。

DreamTalk

一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。

Movie

一款轻松观看电影的网络应用程序,Movie-Web的工作原理是在直观和美观的用户界面中显示来自第三方提供商的视频文件。

GPTEngineer

GPTEngineer 是一款基于AI技术的开源工具,通过简单的文本提示快速生成网页应用原型。它支持自然语言交互,能够根据用户描述自动生成代码,并具备代码改进、错误检测与修正等功能。此外,GPTEngineer 还支持与 GitHub 同步和一键部署。该工具兼容多种AI模型,适用于快速原型开发、Web应用开发、自动化测试、代码重构及教育等多个领域。

大以论文

专业的论文格式排版工具,支持快捷模式和编辑器模式,一键完成论文格式排版工作,确保您的学术论文符合学校的要求和规范。

ReCamMaster

ReCamMaster 是由浙江大学与快手科技联合开发的视频重渲染框架,支持根据用户指定的相机轨迹生成新视角视频。采用预训练模型与帧维度条件机制,实现视频视角、运动轨迹的灵活调整。具备视频稳定化、超分辨率、外扩等功能,适用于视频创作、后期制作、自动驾驶和虚拟现实等领域,提升视频内容的表现力与质量。

灵构笔记

灵构笔记,融合笔记、AI创作和团队协作的知识管理平台。

Hallo

Hallo是由复旦大学、百度公司、苏黎世联邦理工学院和南京大学的研究团队共同开发的一种基于人工智能的肖像图像动画技术。该技术通过分层音频驱动视觉合成、端到端扩散模型、交叉注意力机制、UNet去噪器、时间对齐技术和参考网络等方法,实现了音频与视觉输出的高精度同步。Hallo具备音频同步动画、面部表情生成、头部姿态控制、个性化动画定制、时间一致性维护以及动作多样性等主要功能,显著提升了视频动画的真实感