AI项目与工具

OmniManip

OmniManip是由北京大学与智元机器人联合实验室开发的通用机器人操作框架，结合视觉语言模型与三维操作技术，实现机器人在非结构化环境中的任务执行。其核心为以对象为中心的交互基元表示法，支持零样本泛化、跨平台部署及大规模仿真数据生成。通过双闭环系统设计与任务分解机制，提升操作精度与适应性，适用于日常操作、工业自动化及服务机器人等场景。

AI项目与工具 2025年06月12日 53 点赞 0 评论 668 浏览

IPalettes

IPalettes 是一款AI驱动的颜色调色板生成工具，可根据关键词生成多样化的颜色方案，适用于网页设计、UI设计、服装搭配和室内装饰等领域。其内置多种实用工具，如调色板卡片生成器、照片拼贴生成器等，支持颜色名称查询与照片颜色分析，提升设计效率与创意表达。

AI项目与工具 2025年06月12日 81 点赞 0 评论 653 浏览

Ivy

Ivy-VL是一款专为移动端和边缘设备设计的轻量级多模态AI模型，具备约30亿参数，专注于视觉问答、图像描述及复杂推理等任务，能够有效降低计算资源需求，同时在多模态任务中表现出色，尤其适用于增强现实、智能家居及移动学习等领域。

AI项目与工具 2025年06月12日 21 点赞 0 评论 751 浏览

EMOVA

EMOVA是一款由多所高校与企业联合研发的多模态全能型AI助手，具备处理图像、文本和语音的能力，支持情感化语音对话，并通过轻量级情感控制模块增强了人机交互的自然性。其核心技术包括连续视觉编码器、语义-声学分离的语音分词器及全模态对齐机制，广泛应用于客户服务、教育辅助、智能家居控制等多个领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 844 浏览

Kimi i人嘴替

Kimi i人嘴替是一款基于AI技术开发的沟通辅助工具，主要服务于希望改善人际交往能力的用户。其核心功能包括即时文案生成、社交场景应对指导以及心理建设支持等。此外，该工具还能灵活运用网络流行语，让交流过程更加生动有趣。无论是面对日常对话还是复杂的人际挑战，i人嘴替都能提供有效的解决方案。

AI项目与工具 2025年06月12日 93 点赞 0 评论 535 浏览

Wiseone

Wiseone是一款集成了先进AI技术的浏览器扩展工具，专注于优化用户的网络搜索与阅读体验。它通过聚焦、交叉检查、提问、总结和探索等功能，帮助用户快速理解复杂信息、验证事实、生成摘要并挖掘相关资源。无论是在学术研究、新闻阅读还是日常学习中，Wiseone均能显著提高效率并确保信息的准确性和可靠性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 627 浏览

restorePhotos.io

restorePhotos.io 是一款基于GFPGAN模型的AI工具，专注于修复老旧和模糊的人脸照片。它具备用户友好的界面设计，支持批量处理及隐私保护功能，能够显著提升照片质量和清晰度。凭借其强大的技术支撑，restorePhotos.io 可应用于个人家庭、文化遗产保护、档案管理等多个领域，为用户提供高质量的照片修复服务。

AI项目与工具 2025年06月12日 42 点赞 0 评论 1196 浏览

Molmo 72B

Molmo 72B是一款由艾伦人工智能研究所推出的开源多模态AI模型，集成了图像和文本处理能力，适用于图像描述生成、视觉问答、文档解析及多模态交互等多种任务。凭借其强大的视觉编码能力和先进的模型架构，Molmo 72B在学术基准测试中表现优异，为开源AI技术的发展做出了重要贡献。

AI项目与工具 2025年06月12日 69 点赞 0 评论 682 浏览

AniTalker

AniTalker是一款先进的AI工具，能将单张静态人像与音频同步转化为生动的动画对话视频。它通过自监督学习捕捉面部动态，采用通用运动表示和身份解耦技术减少对标记数据的依赖，同时结合扩散模型和方差适配器生成多样且可控的面部动画。AniTalker支持视频驱动和语音驱动两种方式，并具备实时控制动画生成的能力。

AI项目与工具 2025年06月12日 62 点赞 0 评论 912 浏览

PaddleSpeech

PaddleSpeech是百度飞桨团队开发的开源语音处理工具，涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式，适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架，提供高效的深度学习模型和丰富的音频处理能力，适用于多种实际应用需求。

AI项目与工具 2025年06月12日 87 点赞 0 评论 599 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间