AI项目与工具

HumanRig

HumanRig是由阿里巴巴团队研发的3D人形角色自动绑定系统，提供大规模高质量数据集和先进算法，支持从粗到细的骨架估计与蒙皮优化。其核心组件包括先验引导骨架估计器（PGSE）和网格-骨架互注意网络（MSMAN），适用于游戏开发、影视制作、VR/AR及数字人应用，有效提升3D角色动画制作效率和质量。

AI项目与工具 2025年06月11日 11 点赞 0 评论 905 浏览

海螺视频APP

海螺视频APP是一款基于AI技术的视频生成工具，支持文生视频和图生视频功能，提供丰富的镜头控制选项，让用户能像专业导演一样创作动态视频。该工具适用于多种场景，如社交媒体、广告营销、影视制作等，操作简便，适合各类用户使用。

AI项目与工具 2025年06月12日 21 点赞 0 评论 905 浏览

Vision Search Assistant

Vision Search Assistant (VSA) 是一种结合视觉语言模型与网络代理的框架，旨在提升模型对未知视觉内容的理解能力。它通过网络检索，使 VLMs 能够处理和回答有关未见图像的问题。VSA 在开放集和封闭集问答测试中表现出色，支持图像描述生成、网络知识搜索、协作生成等功能，可应用于图像识别、新闻分析、教育、电商和旅游等多个领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 905 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 905 浏览

InstantID 是一种基于扩散模型的图像生成技术，专注于实现零次（zero-shot）身份保留（Identity-Preserving）的个性化图像合成。该技术允许用户仅使用一张面部图像，在多种风格中生成个性化的图像，同时确保高保真度。其主要功能包括个性化图像合成、身份特征保留、风格迁移、新视角合成、身份插值和多身份合成。InstantID 兼容预训练模型，无需额外微调即可实现灵活的图像生成。

AI项目与工具 2024年01月01日 56 点赞 0 评论 905 浏览

唤醒食物

唤醒食物是一个基于AI技术的个性化食疗方案平台。它提供1781种食物的营养成分查询，科学食疗方案以及补充剂的真实作用评估。平台还提供食物对比工具和营养速查榜，帮助用户优化饮食计划。此外，唤醒食物还提供全球健康资讯，旨在助力用户的健康管理。

AI项目与工具 2025年06月12日 65 点赞 0 评论 906 浏览

Kimi翻译通

Kimi翻译通是一款专注于中英文互译的智能翻译工具，支持直译与意译，具备高精度翻译能力，尤其擅长处理专业学术论文及长篇文档。它兼容多种文件格式，提供分段翻译功能，适用于学术研究、商务交流、法律文件翻译等多个领域，帮助用户突破语言障碍，提升跨语言工作效率。

AI项目与工具 2025年06月12日 69 点赞 0 评论 906 浏览

Whisper Input

Whisper Input 是一款开源语音输入工具，基于 Python 和 OpenAI Whisper 模型开发，支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本，具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 906 浏览

Playground v3

Playground v3是一款基于大型语言模型（LLM）的文本到图像生成工具，具备240亿参数量的潜扩散架构（LDM），能够精准理解和生成复杂的图像内容，支持RGB颜色控制和多语言文本生成。其核心功能包括文本到图像生成、图形设计、RGB颜色控制和多语言支持，广泛应用于设计、内容创作、游戏开发、广告等多个领域。

AI项目与工具 2025年06月12日 52 点赞 0 评论 906 浏览

Graphy

Graphy 是一款利用 AI 技术实现数据可视化的平台，能够自动创建图表并提供深度洞察。其核心功能包括一键增强图表、与 Google Sheets 集成以及支持团队协作。Graphy 适用于多种场景，如业务报告、市场营销、财务分析和教育培训，帮助用户高效传达数据背后的含义。

AI项目与工具 2025年06月12日 98 点赞 0 评论 906 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间