生成

Diffusion Self

Diffusion Self-Distillation (DSD) 是一种基于预训练文本到图像扩散模型的零样本定制图像生成技术,通过自动生成数据集并微调模型,支持文本条件下的图像到图像转换任务。其核心在于利用生成图像网格与视觉语言模型筛选高质量配对数据集,实现无需人工干预的身份保持定制化图像生成。该技术广泛应用于艺术创作、游戏开发、影视制作、广告营销及个性化商品等领域。

涌墨AI

一款面向软件行业的一站式AI智写工具,提供全流程、智能化、高质量的文档编写解决方案,覆盖从市场调研、招投标、项目实施到日常办公的各类文档需求。

CSM 3D Viewer

CSM 3D Viewer提供api、接口和开源软件,将多模态输入和体验转换为数字模拟器,用于人工智能训练和内容创建。我们相信,学习生成世界模型是实现AGI的系统路径,类似于儿童从经验中...

DeerFlow

DeerFlow 是字节跳动推出的开源研究框架,结合语言模型与多种工具,支持高效完成复杂研究任务。具备多Agent架构,支持自然语言交互与智能协作,适用于研究报告、播客、演示文稿等内容生成。支持多种语言模型和外部工具集成,提供灵活配置与扩展能力,广泛应用于学术、市场、教育及个人知识管理等领域。

WonderWorld

WonderWorld是一款基于斯坦福大学和麻省理工学院合作研发的3D场景生成框架,通过Fast LAyered Gaussian Surfels(FLAGS)表示法与引导深度扩散技术,从单张图片快速生成连贯且多样化的虚拟场景。用户可实时交互,生成包括城市、自然、幻想等多种风格的3D环境,并适用于游戏开发、虚拟现实、增强现实以及建筑设计等多个领域。

Cover AI

一款专业的AI封面生成工具,支持免费生成小红书封面、公众号封面、小说封面、红包封面、视频封面等多种类型的封面。

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架,能够实现唇部动作与音频信号的精准同步,并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑,基于130小时中文视频数据集训练,在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域,为视频内容创作提供了创新解决方案。

魔音工坊

魔音工坊是由北京小问智能科技有限公司开发的一款配音软件,为用户提供一站式AI配音服务。它被广泛应用于短视频制作、有声书、广告、宣传纪录片等领域,是一款专业的AI语音配音与...

百度文心歌词生成器

百度文心歌词生成器是百度公司开发的一款基于人工智能技术的创新工具,它利用百度的文心大模型为用户提供快速生成歌词的服务。

Rizzle

Rizzle 是一款人工智能视频创作平台,能够将文本、播客和音频内容快速转化为具有专业外观的视频。平台通过与 Getty Images 的合作,提供了超过 5 亿张图片和视频的媒体资源库,使用户能够自定义文本样式、画面比例、背景音乐等元素。其主要功能包括缩略图制作、文本高亮剪辑、地图生成、无面孔视频等,简化了视频制作流程,适用于社交媒体营销、内容创作、教育、产品演示、新闻报道及企业内部沟通等多种应