生成

Meissonic

Meissonic是一款由阿里巴巴集团与多家高校联合开发的文本到图像合成模型,基于掩蔽图像建模技术,结合多模态和单模态Transformer层、高级位置编码策略及优化采样条件,实现了高分辨率图像生成、文本到图像转换、零样本图像编辑等功能。其高效性能使其适用于多种场景,包括艺术创作、媒体娱乐、广告营销、教育及电子商务等领域。 ---

WonderWorld

WonderWorld是一款基于斯坦福大学和麻省理工学院合作研发的3D场景生成框架,通过Fast LAyered Gaussian Surfels(FLAGS)表示法与引导深度扩散技术,从单张图片快速生成连贯且多样化的虚拟场景。用户可实时交互,生成包括城市、自然、幻想等多种风格的3D环境,并适用于游戏开发、虚拟现实、增强现实以及建筑设计等多个领域。

NotebookLlama

NotebookLlama是一款基于Meta开发的开源工具,能够将PDF文档自动转换为高质量播客内容。它通过LLaMa模型完成PDF预处理、文本转播客脚本、增加戏剧性元素以及文本转语音合成等步骤,无需人工干预即可生成专业水准的播客。NotebookLlama提供了详细的教程和操作指南,并支持多种应用场景,包括教育、新闻、企业培训和有声书制作等。

BlinkShot

BlinkShot 是一款基于 AI 的实时图像生成工具,支持用户通过输入描述性提示快速生成高质量图像。它采用 Together AI 的 Flux Schnell 技术,提供自定义分辨率和生成步骤功能,适合艺术创作、设计、游戏开发、广告营销等多个领域。工具基于开源技术开发,具备良好的可扩展性和可观察性。

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型,擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术,支持视觉文本生成、编辑、理解及感知等功能,广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练,TextHarmony在视觉与语言生成任务中表现出色。

Exemplary AI

Exemplary AI是一款基于AI技术的内容处理工具,可将长视频和音频转换为短视频片段、文字记录及摘要等形式,同时支持多语言字幕生成和社交媒体优化。其主要功能包括视频剪辑、文本记录、AI写作、多语言支持等,广泛应用于社交媒体营销、教育培训、企业培训等领域,助力用户高效创作并传播优质内容。

EveryoneNobel

EveryoneNobel是一款基于ComfyUI框架的开源AI工具,专注于生成个性化诺贝尔奖风格图像。用户上传肖像照片并输入基本信息后,系统可自动生成具有独特风格和丰富细节的图像。工具支持个性化定制,适用于社交媒体分享、个人成就展示、教育用途及团队激励等多种场景。 ---

vidyo.ai

Vidyo.ai是一款基于人工智能的视频编辑工具,可将长视频自动剪辑为适合社交媒体的短视频片段。其主要功能涵盖智能剪辑、尺寸适配、字幕生成、播放速度调节及音频优化等。该工具支持多语言操作,适合内容创作者和品牌方高效制作高质量视频内容。

ReadPo

ReadPo是一款基于AI技术的知识创作辅助工具,集成了内容聚合、智能分析、写作指导等功能,支持从多种渠道获取信息,并将其转化为高质量内容。其特色包括自动评分排序、主题阅读支持、个性化定制选项以及Markdown转图文海报功能,广泛应用于公众号运营、博客写作、新闻编辑等领域,旨在提升内容生产效率和质量。

Unbounded

Unbounded是一款由谷歌与北卡罗来纳大学教堂山分校合作研发的无限人生模拟游戏,采用大型语言模型(LLM)和视觉生成模型,使玩家能够在开放世界中自由探索并引导角色互动,形成连贯的故事线。该工具具备实时动态生成游戏机制、角色个性化定制、视觉一致性维护等功能,同时适用于娱乐、教育、创意写作及心理治疗等多个领域。