生成

Jellypod

Jellypod 是一款基于 AI 的播客制作工具,支持从网页、PDF 等多种格式自动生成脚本并转为音频,涵盖 30 多种语言和口音。用户可自定义 AI 主持人,编辑脚本并一键发布到主流平台,具备高质量音频生成与内容管理功能,适用于企业、教育和个人品牌建设等场景。

SlidesOrator

一款将静态PPT转化为互动演示内容的工具,主要功能有旁白生成、数字人播报、实时问答等。用户上传PDF文件后,能快速生成互动演示,适用于教育、企业培训、产品介绍等场景。

Namecheap Logo Maker

Namecheap 是一个Logo制作器,可让您在几分钟内设计自己的Logo。Namecheap 的Logo制作器易于使用,不需要任何设计技能。您只需要回答一些有关您的业务的问题,例如名称、行业和风格偏好。

DeepFloyd

DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习。

INFP

INFP是一款基于音频驱动的头部生成框架,专为双人对话设计,具备自动角色转换功能。它通过两个阶段实现头部生成:基于动作的头部模仿和音频引导的动作生成。同时,INFP提出了大规模双人对话数据集DyConv,推动了相关领域的研究进展。该工具适用于视频会议、虚拟助手、教育培训、客户服务等多个场景,支持实时互动并可调节生成风格。

Higgsfield

Higgsfield是一款基于AI的视频生成平台,能够将文本提示转化为高质量视频内容,支持多种风格如现实主义、赛博朋克等。具备电影级相机控制、深度定制、资源管理等功能,适用于社交媒体、广告及电影制作领域,提升创作效率与质量。

深言科技

深言科技是一家由孙茂松教授和其学生一同创办的创业公司,致力于使用世界领先的人工智能和自然语言处理技术,为数亿脑力劳动深言科技(DeepLang AI)者和数千万组织的信息处理全流...

RecCloud

一个人工智能驱动的多媒体服务平台,RecCloud专门为视频和音频处理提供一套全面的工具。

Gamma PPT生成工具

Gamma 是幻灯片的替代品 - 一种快速、简单的方式来分享和展示您的作品。创建易于现场讨论或异步共享的引人入胜的演示文稿、备忘录、简报和文档。全部在您的浏览器中,无需下载或安装。

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型,能够生成1024×1024像素的高分辨率图像,质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块,HART实现了高效的图像生成,并在多个指标上表现出色,包括重构FID、生成FID以及计算效率。