AI项目与工具

GitFriend

GitFriend 是一款基于 AI 技术的 GitHub 辅助工具,支持 AI 聊天答疑、动态生成 README 文件、Gitmoji 表情符号集成以及 Google 账号登录等功能,旨在提升开发效率和项目管理体验,适合开发者及团队使用。

3D AI Studio

3D AI Studio是一款基于AI技术的3D建模工具,支持文本到3D、图像到3D转换以及纹理处理等多种功能。它能够快速生成高质量的3D模型,适用于游戏开发、建筑设计、数字艺术创作等多个领域,同时具备多格式兼容性和便捷的操作体验,为用户提供高效且灵活的解决方案。

Direct3D

Direct3D-S2是由南京大学、DreamTech、复旦大学和牛津大学联合开发的高分辨率3D生成框架,基于稀疏体积表示和空间稀疏注意力(SSA)机制,提升扩散变换器(DiT)的计算效率并降低训练成本。该框架包含全端到端的稀疏SDF变分自编码器(SS-VAE),支持多分辨率训练,在1024³分辨率下仅需8个GPU即可训练。Direct3D-S2能够从图像生成高分辨率3D形状,具有精细几何细节和高

Glyph

Glyph-ByT5-v2是一个由多家知名学术机构合作开发的多语言视觉文本渲染工具。它支持10种不同语言的视觉文本渲染,通过构建包含大量字形-文本对和平面设计图像-文本对的数据集,结合先进的步骤感知偏好学习技术,显著提升了视觉文本的拼写准确性和审美质量。该工具适用于平面设计、广告制作、数字艺术、出版行业及品牌标识设计等多个领域。 ---

MotionFix

MotionFix是一个开源的3D人体动作编辑工具,采用自然语言描述与条件扩散模型TMED相结合的方式,支持通过文本指令精准编辑3D人体动作。其主要功能包括文本驱动的动作编辑、半自动数据集构建、多模态输入处理及基于检索的评估指标。MotionFix适用于动画制作、游戏开发、虚拟现实等多个领域,为动作编辑提供了灵活性与精确性。

ComfyGen

ComfyGen是一款基于大型语言模型(LLM)的文本到图像生成系统,能够根据用户提供的文本提示自动生成高质量图像。它通过结合多种专业组件如微调基础模型、LoRAs、嵌入技术和超分辨率处理等构建复杂工作流,并采用两种基于LLM的方法优化图像生成质量,适用于艺术创作、游戏开发、广告设计、电影制作等多个领域。

SVDQuant

SVDQuant是一种由MIT研究团队开发的后训练量化技术,专注于通过4位量化减少扩散模型的内存占用和推理延迟。它利用低秩分支技术吸收量化异常值,支持DiT和UNet架构,并能无缝集成LoRAs。SVDQuant适用于移动设备、个人电脑、云计算平台及低功耗设备,可大幅提升图像生成和处理效率。

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型,主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构,集成了视觉和语言信息,通过Siglip视觉编码器和Qwen-2语言模型,实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

jagoda.AI

[jagoda.AI是一款利用人工智能技术的在线学习平台,主要面向学生提供个性化辅导服务。它支持超过30个学科的解答,可翻译20多种语言,帮助学生解决家庭作业难题。平台通过分析学生的年级和学校水平,提供定制化辅导,并附带详细解题步骤,促进自主学习。此外,jagoda.AI支持拍照上传和语音输入,提供基础免费计划及付费订阅选项,适用于家庭作业帮助、自主学习、语言学习支持等多种场景。]

Klic Studio

Klic Studio是一款基于大型语言模型的视频翻译与配音工具,支持56种语言翻译,适用于多平台内容制作。具备高精度字幕识别、智能分割对齐、语音克隆及一键视频合成等功能,简化视频创作流程,提升多语言内容传播效率。