生成

Ruyi

Ruyi是一款基于DiT架构的图生视频大模型,支持多分辨率和多时长的视频生成,具有首帧、首尾帧控制、运动幅度调整及镜头方向控制等功能。它通过Casual VAE模块和Diffusion Transformer实现视频数据的压缩与生成,旨在降低动漫和游戏内容的开发周期和成本。目前,Ruyi-Mini-7B版本已开源。

UX Pilot

UX Pilot 是一款 AI 驱动的 UX/UI 设计工具,支持高保真界面生成、线框图探索、Figma 整合及全流程设计管理。它通过智能算法提升设计效率,支持团队协作与多平台适配,适用于产品原型验证、设计迭代与开发交付,助力用户实现高效、精准的设计流程。

AIPaperGPT

AIPaperGPT是一款基于AI技术的学术写作辅助工具,提供选题建议、文献综述、论文框架构建、内容生成及查重控制等功能。平台支持多种学术服务,如开题报告和答辩PPT制作,适用于学生和研究者,帮助提升写作效率与质量,保障原创性与规范性。

Magic Animate

Magic Animate是一项开创性的开源项目,简化了动画创作,允许您从单个图像和动态视频制作动画视频。

VectorArt.ai

VectorArt.ai 是一款基于人工智能技术的在线平台,专注于通过文本或草图生成高质量的矢量图像。它支持 SVG 格式,具备无损缩放特性,适用于网页设计、平面印刷等多个场景。主要功能包括文本到图像生成、草图到图像转换、自定义 SVG 创建及多种插画风格选择,同时提供免费图像资源和布局优化工具。

Galileo AI

Galileo AI,一款功能强大、易用性高、可靠性强的人工智能UI设计工具。

The New Black AI

一个AI时尚设计生成器。它是一个网站,通过利用人工智能的力量,可帮助设计师更快地创建独特的服装设计,并增强他们的创造力。

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。

LDGen

LDGen是一款结合大型语言模型与扩散模型的文本到图像生成工具,支持零样本多语言生成,提升图像质量和语义一致性。通过分层字幕优化、LLM对齐模块和跨模态精炼器,实现文本与图像的高效交互。实验表明其性能优于现有方法,适用于艺术创作、广告设计、影视制作等多个领域,具备高效、灵活和高质量的生成能力。

Mobvoi MCP Server

Mobvoi MCP Server是出门问问推出的一站式AI工具,集成语音生成、声音克隆、图片驱动数字人、视频配音等多模态能力。用户可通过简单输入文本调用功能,支持多客户端和多场景应用。基于标准化接口和开源生态,提供高效、灵活的数字生产力解决方案,适用于内容创作、虚拟主播、在线教育等多个领域。