建模

LegoGPT

LegoGPT是一款由卡内基梅隆大学开发的AI工具,可根据文本描述生成稳定、可组装的乐高积木模型。它结合自回归语言模型与大规模数据集,支持自动纹理上色、物理稳定性验证及手动或机器人组装。该工具能有效提升创意设计效率,适用于教育、玩具开发及自动化生产等多个场景。

UniRig

UniRig是由清华大学计算机系与VAST联合开发的自动骨骼绑定框架,基于自回归模型和交叉注意力机制,可高效生成高质量骨骼结构和蒙皮权重。其支持多种3D模型类型,涵盖动漫角色、有机与无机结构等,广泛应用于动画制作、游戏开发、虚拟角色设计等领域。项目提供开源代码和详细文档,助力提升3D动画制作效率与质量。

Video

Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积(STC)连接器和音频分支,显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。

PROMPT HUNT

Prompt Hunt 是一款基于AI技术的艺术创作平台,整合了Stable Diffusion、DALL-E和自有Chroma模型等先进工具,支持用户通过简单的操作生成高质量的艺术图像。平台提供丰富的样式库、主题模板以及参数调节功能,便于用户个性化定制作品。此外,Prompt Hunt还打造了一个活跃的社区,鼓励用户分享创意、交流经验,推动AI艺术的普及与发展。

VALL

VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为...

Vibe Draw

Vibe Draw是一款开源AI 3D建模工具,能将2D草图自动转换为高质量3D模型,并支持文本提示优化和模型编辑。用户可一键导出为glTF格式,适用于创意设计、教育、游戏开发等多个领域。工具基于Next.js、React、Three.js、FastAPI等技术,具备高效的实时交互与异步处理能力。

Stable Video 3D (SV3D)

Stable Video 3D(SV3D)是一款由Stability AI公司开发的多视角合成和3D生成模型,能够从单张图片生成一致的多视角图像,并进一步优化生成高质量的3D网格模型。该模型在视频扩散模型基础上进行改进,提供更好的质量和多视角体验。主要功能包括多视角视频生成、3D网格创建、轨道视频生成、相机路径控制以及新视角合成。SV3D在新视角合成方面取得显著进展,能够生成逼真且一致的视图,提升

Kimi探索版

Kimi探索版是一款基于深度推理的AI搜索工具,具备强大的搜索、分析及自我优化能力。它能够将复杂问题分解成多个子问题,通过逐步推理与数据整合生成精确解答,并支持数学建模、编程处理及多语言交流。此外,其自我反思机制进一步提升了答案的准确性,广泛适用于学术研究、市场分析、学习辅导和技术支持等场景。

Genie 2

Genie 2是一款由DeepMind开发的大规模基础世界模型,其核心功能包括基于单一图片生成可交互3D游戏世界、模拟物体交互及物理效果、支持多类型动作控制、具备长时间记忆能力以及实时生成新场景内容。该工具不仅适用于智能体训练与评估,还广泛应用于游戏开发、模拟与训练、机器人学习以及虚拟现实和增强现实等领域。