Gemini Robotics Gemini Robotics 是谷歌 DeepMind 基于 Gemini 2.0 开发的机器人系统,融合视觉-语言-动作模型,支持复杂任务执行与环境适应。具备三维空间理解、物体检测、轨迹预测和开放词汇指令执行能力,适用于工业制造、物流仓储、家庭服务、医疗健康等多个领域。系统通过数据驱动训练,结合真实操作与多模态信息,实现高效、灵活的机器人控制。 AI项目与工具 2025年06月12日 17 点赞 0 评论 584 浏览
Spirit LM Spirit LM 是一种由 Meta AI 开发的多模态语言模型,能够处理文本和语音数据,支持跨模态学习。其基础版(BASE)和表达版(EXPRESSIVE)分别侧重于语义理解和情感表达。Spirit LM 可用于自动语音识别(ASR)、文本到语音(TTS)、语音分类及情感分析等任务,在语音助手、语音转写、有声读物等领域具有广泛应用前景。 AI项目与工具 2025年06月12日 40 点赞 0 评论 584 浏览
悦灵犀AI 悦灵犀AI是一款基于先进AI技术的创作平台,支持文生图、文生视频、背景替换、证件照生成及照片修复等多种功能。其智能助手和丰富工具使用户能够高效创作艺术作品,并广泛应用于艺术设计、广告营销、教育等领域。 AI项目与工具 2025年06月12日 51 点赞 0 评论 584 浏览
OpenScholar OpenScholar是一款由华盛顿大学与艾伦AI研究所联合研发的检索增强型语言模型,专为科学家设计,能够高效检索并综合海量科学文献信息,生成基于文献的事实性回答。该工具具备强大的跨学科适用性,涵盖计算机科学、生物医学等多个领域,同时支持自我反馈迭代优化,显著提升回答质量和引用可靠性。所有相关资源已完全开源,便于全球学者使用与研究。 AI项目与工具 2025年06月12日 30 点赞 0 评论 584 浏览
SimpleQA SimpleQA是OpenAI开发的一个基准测试工具,用于评估大型语言模型在回答简短、事实性问题时的表现。它包含4326个问题,每个问题都有唯一的正确答案,并通过严格的验证流程确保质量。SimpleQA不仅能够测试模型的事实性回答能力,还能衡量其自我认知水平和校准能力,广泛应用于模型开发、学术研究及教育工具等领域。 AI项目与工具 2025年06月12日 93 点赞 0 评论 584 浏览
OpenAI o4 OpenAI o4-mini 是一款高性能、低成本的小型推理模型,专为快速处理数学、编程和视觉任务优化。它具备多模态能力,可结合图像与文本进行推理,并支持工具调用以提高准确性。在多项基准测试中表现优异,尤其在数学和编程领域接近完整版模型。适用于教育、数据分析、软件开发及内容创作等多个场景,是高效率与性价比兼备的AI工具。 AI项目与工具 2025年06月11日 27 点赞 0 评论 584 浏览
EasyControl EasyControl是基于扩散变换器(DiT)架构的高效控制框架,采用轻量级LoRA模块实现多条件控制,支持图像生成、风格转换、动画制作等任务。其具备位置感知训练范式和因果注意力机制,优化计算效率,提升生成质量与灵活性,适用于多种图像处理场景。 AI项目与工具 2025年06月12日 48 点赞 0 评论 585 浏览
MotionFix MotionFix是一个开源的3D人体动作编辑工具,采用自然语言描述与条件扩散模型TMED相结合的方式,支持通过文本指令精准编辑3D人体动作。其主要功能包括文本驱动的动作编辑、半自动数据集构建、多模态输入处理及基于检索的评估指标。MotionFix适用于动画制作、游戏开发、虚拟现实等多个领域,为动作编辑提供了灵活性与精确性。 AI项目与工具 2025年06月12日 13 点赞 0 评论 585 浏览
Bestprompts 一个中文行业prompt收录网站。 一个全行业AI会话辅助工具,为各行业的内容创作者提供全面准确的提示语。 Ai提示指令 2025年06月05日 28 点赞 0 评论 585 浏览
Stagehand Stagehand 是一款基于自然语言处理的 AI 工具,专注于网页自动化操作。其核心功能包括自然语言驱动的 `act`、`extract` 和 `observe` API,支持原子化指令执行和多模型适配。Stagehand 可实现网页测试、数据抓取、表单操作及内容监控等多样化任务,广泛应用于网页测试、数据分析、办公自动化等领域。 AI项目与工具 2025年06月12日 51 点赞 0 评论 585 浏览