R

PixArt

PixArt-Σ是一款基于扩散Transformer架构(DiT)的文本生成图像模型,专为生成高达4K分辨率的高质量图像而设计。该模型通过整合高级元素并采用从弱到强的训练方法,不仅提升了生成图像的保真度,还增强了图像与文本提示之间的对齐效果。PixArt-Σ的生成图像在美学质量上可媲美当前顶级的文本到图像产品,并且在遵循文本提示方面表现出色。主要功能包括4K分辨率图像生成、高保真转换、高效率训练和

Motion Dreamer

Motion Dreamer是由香港科技大学(广州)研发的视频生成框架,采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制,支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能,已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

Markdown

Markdown-to-Image 是一个基于 React 的开源工具,可将 Markdown 文本转换为图像,支持多种输出格式和自定义样式。其应用场景包括社交媒体内容创作、技术文档可视化、博客标题设计以及教育和营销材料制作,具备强大的灵活性和易用性。

Lobe Chat

Lobe Chat 是一个免费开源的高性能 AI 聊天机器人框架,具备多种功能,如 GPT-4 视觉识别、文字语音转换、灵活的插件系统及个性化主题模式。用户能够轻松部署和扩展功能,适用于各种场景。该框架已在 GitHub 上获得近 14K 星标,展示了其受欢迎程度和实用性。

Zero123

一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。

DeepSeek百宝箱

DeepSeek百宝箱是DeepSeek官方维护的GitHub项目,集成了多种支持DeepSeek API的工具和应用,涵盖聊天、知识管理、开发等多个领域。提供开箱即用、详实文档、本地化支持及多平台兼容性,助力开发者高效使用语言模型,提升工作效率。支持模型训练、部署、监控全流程,具备低代码配置、智能上下文感知、毫秒级响应等特性,适用于办公、编程、内容创作等多种场景。

IMI Prompt

IMI Prompt是一个全面的Midjourney v5艺术品提示生成器,用户可以创建独特的Midjourney v5艺术品,可在Web、Android和iOS上使用。

Playground v3

Playground v3是一款基于大型语言模型(LLM)的文本到图像生成工具,具备240亿参数量的潜扩散架构(LDM),能够精准理解和生成复杂的图像内容,支持RGB颜色控制和多语言文本生成。其核心功能包括文本到图像生成、图形设计、RGB颜色控制和多语言支持,广泛应用于设计、内容创作、游戏开发、广告等多个领域。

Zapier MCP

Zapier MCP 是一种 AI 工具,允许 AI 助手安全、快速地连接至 7000 多个应用程序,无需复杂 API 集成。它支持自动化任务如发送消息、管理数据、安排事件,并提供细粒度权限控制与安全验证。适用于开发者、AI 用户和企业团队,提升工作效率与协作能力。

诗三百

AI写诗诗三百,人工智能在线诗歌写作平台,即在线作诗机,包含AI在线作诗机。