生成

Jambot

JamBot 是一个由人工智能驱动的工具,存在于Figma的FigJam中。它旨在帮助用户更快地启动初稿并加速进展。使用JamBot,用户可以与ChatGPT一起在同一画布上创建视觉思维导图、采取多...

VQAScore

VQAScore是一种基于视觉问答(VQA)模型的评估工具,用于衡量文本提示生成图像的质量。它通过计算回答“是”概率的方式评估图像与文本提示的对齐程度,无需额外标注,提供更精确的结果。VQAScore支持多种生成任务,包括图像、视频及3D模型,并能作为多模态学习的研究工具,在自动化测试和质量控制中发挥重要作用。

Mureka

Mureka是一款由昆仑万维开发的AI音乐创作平台,旨在为专业艺术家和音乐爱好者提供高效、稳定的音乐创作环境。用户可以输入歌词并添加参考音乐,通过平台提供的Style功能控制音乐风格,实现个性化音乐创作。平台支持音乐风格和旋律控制,以及对歌曲各部分的自由调整,如前奏、主歌、副歌等。生成的音乐具有高度稳定性和可控性,用户可将其展示和销售,获得经济收益。Mureka还支持多语言音乐创作,涵盖多种语言,

DAM

DAM-3B是英伟达开发的多模态大语言模型,专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域,生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络,有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理,适用于动态场景。模型基于Transformer架构,支持多模态输入,广泛应用于内容创作、智能交互及无障碍工具等领域。

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型,能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型(LRM)设计,采用先进的图像编码、三平面NeRF表示及优化训练策略,支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域,具有高效、高精度和广泛适用性的特点。

UNO

UNO是字节跳动推出的AI图像生成框架,支持单主体和多主体图像生成,解决多主体一致性难题。采用扩散变换器和渐进式跨模态对齐技术,结合通用旋转位置嵌入(UnoPE),实现高一致性与可控性。适用于虚拟试穿、产品设计、创意设计等多个领域,具备强大泛化能力,已开源并提供完整技术文档。

Inverse Painting

Inverse Painting 是一种基于 AI 的创新技术,能够逆向还原绘画过程,通过分析艺术家的绘画视频学习技巧与顺序,生成详细的绘画指令,逐步更新画布,模拟创作流程。该工具可应用于艺术教育、艺术创作辅助、文化遗产保护、艺术品鉴定、娱乐产业及交互式媒体等多个领域。

Smodin

Smodin.io是一款多语言写作辅助平台,为全球的学生、作家和互联网工作者提供一系列工具来改善写作。它提供文本改写、检测抄袭、自动引用生成和多语言翻译等功能,以提高写作内容的质量和效率。

Phraser

Phraser 是一款人工智能驱动的工具,专为 Midjourney、Dall-E、Stable Diffusion、Disco Diffusion 和 Craiyon 等领先艺术生成器的快速创作而设计。

Toorch

Toorch是一款基于人工智能技术的新闻阅读器,主要功能包括连续对话支持、搜索历史查询、快速内容生成、个性化体验(点赞与收藏)、划词搜索以及图片与链接展示。其设计旨在简化信息获取过程,提供直观且连贯的搜索服务。适用于即时新闻获取、信息追踪、研究学习、个性化内容发现及跨语言内容访问等多个场景。