生成

Podcastfy

Podcastfy 是一款基于生成式人工智能技术开发的开源工具,可将网络文章、PDF 文件及纯文本转化为多语言对话式音频。它不仅支持多源文本合并,还具备强大的文本转语音功能,允许用户选择不同的语音模型来优化音频效果。此外,其开源特性便于开发者根据需求进行个性化定制,广泛适用于内容摘要、语言本地化、教育材料转化等多个领域。

Relume

Relume是一款基于AI的网站构建平台,主要功能包括AI生成网站地图、线框图转换、UI风格指南创建等,支持Webflow和Figma无缝集成,并提供高效的跨团队协作功能。适用于初创企业、自由职业者及数字代理公司,助力快速高效地完成网站设计与开发。

OWL

OWL是一款基于CAMEL-AI框架的多智能体协作系统,支持任务自动化、角色分配与动态交互。其核心功能包括任务分解、记忆模块、灵活部署及大模型驱动的智能体架构。适用于知识工作、智能交通、医疗健康、电商推荐和环境监测等多个场景,提升任务执行效率与智能化水平。

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型,采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法,提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成,兼容加速技术,推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

瓦兔推文工厂

智能AI绘画推文小助手,专为动漫和游戏爱好者打造的AI漫画推文工具,一个能快速出图的简单好用AI漫画剪辑作图工具。

MotionGen

MotionGen是一款由元象科技开发的3D动作生成模型,它结合了大模型、物理仿真和强化学习算法,使得用户通过简单的文本指令就能生成逼真且流畅的3D动作。该工具简化了3D动画的制作过程,提升了创作效率。其主要功能包括文本到动作的转换、高度逼真和流畅的动作生成、个性化定制、高效的制作流程和技术融合。

AiSlides.chat

AiSlides.chat 是一款基于AI的PPT制作工具,支持自然语言输入和实时对话式编辑,自动生成大纲和页面设计。提供智能图表、图片管理、主题设置及多格式导出功能,适用于企业汇报、学术展示、产品推广等场景,提升演示文稿的制作效率与专业度。

VideoLingo

VideoLingo是一款集成了自然语言处理与大型语言模型技术的全自动视频翻译工具,具备智能字幕分割、上下文感知翻译、精准字幕对齐及高质量配音等功能。它能够高效处理视频翻译任务,适用于在线教育、企业培训、视频内容创作等多个领域,帮助用户突破语言障碍,提升内容传播效果。

Eleven Labs

Eleven Labs的长格式语音生成平台使用人工智能为创作者和出版商创造自然而引人注目的声音。

3DIS

3DIS-FLUX是一种基于深度学习的多实例图像生成框架,采用两阶段流程:先生成场景深度图,再进行细节渲染。通过注意力机制实现文本与图像的精准对齐,无需额外训练即可保持高生成质量。适用于电商设计、创意艺术、虚拟场景构建及广告内容生成等领域,具备良好的兼容性和性能优势。