生成 - 智狐AI导航

Jambot

JamBot 是一个由人工智能驱动的工具，存在于Figma的FigJam中。它旨在帮助用户更快地启动初稿并加速进展。使用JamBot，用户可以与ChatGPT一起在同一画布上创建视觉思维导图、采取多...

创作工具 1970年01月01日 0 点赞 0 评论 799 浏览

VQAScore

VQAScore是一种基于视觉问答（VQA）模型的评估工具，用于衡量文本提示生成图像的质量。它通过计算回答“是”概率的方式评估图像与文本提示的对齐程度，无需额外标注，提供更精确的结果。VQAScore支持多种生成任务，包括图像、视频及3D模型，并能作为多模态学习的研究工具，在自动化测试和质量控制中发挥重要作用。

AI项目与工具 2025年06月12日 86 点赞 0 评论 798 浏览

Mureka是一款由昆仑万维开发的AI音乐创作平台，旨在为专业艺术家和音乐爱好者提供高效、稳定的音乐创作环境。用户可以输入歌词并添加参考音乐，通过平台提供的Style功能控制音乐风格，实现个性化音乐创作。平台支持音乐风格和旋律控制，以及对歌曲各部分的自由调整，如前奏、主歌、副歌等。生成的音乐具有高度稳定性和可控性，用户可将其展示和销售，获得经济收益。Mureka还支持多语言音乐创作，涵盖多种语言，

AI项目与工具 2025年06月12日 74 点赞 0 评论 798 浏览

DAM

DAM-3B是英伟达开发的多模态大语言模型，专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域，生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络，有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理，适用于动态场景。模型基于Transformer架构，支持多模态输入，广泛应用于内容创作、智能交互及无障碍工具等领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 798 浏览

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型，能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型（LRM）设计，采用先进的图像编码、三平面NeRF表示及优化训练策略，支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域，具有高效、高精度和广泛适用性的特点。

AI项目与工具 2025年06月12日 80 点赞 0 评论 798 浏览