模型

腾讯元宝电脑版

腾讯公司推出的一款基于混元大模型的AI助手,拥有AI搜索、AI总结、AI写作等功能,并提供了多个特色AI应用,如AI头像、口语陪练、超能翻译等。

EasyControl

EasyControl是基于扩散变换器(DiT)架构的高效控制框架,采用轻量级LoRA模块实现多条件控制,支持图像生成、风格转换、动画制作等任务。其具备位置感知训练范式和因果注意力机制,优化计算效率,提升生成质量与灵活性,适用于多种图像处理场景。

Gemini Robotics

Gemini Robotics 是谷歌 DeepMind 基于 Gemini 2.0 开发的机器人系统,融合视觉-语言-动作模型,支持复杂任务执行与环境适应。具备三维空间理解、物体检测、轨迹预测和开放词汇指令执行能力,适用于工业制造、物流仓储、家庭服务、医疗健康等多个领域。系统通过数据驱动训练,结合真实操作与多模态信息,实现高效、灵活的机器人控制。

MotionFix

MotionFix是一个开源的3D人体动作编辑工具,采用自然语言描述与条件扩散模型TMED相结合的方式,支持通过文本指令精准编辑3D人体动作。其主要功能包括文本驱动的动作编辑、半自动数据集构建、多模态输入处理及基于检索的评估指标。MotionFix适用于动画制作、游戏开发、虚拟现实等多个领域,为动作编辑提供了灵活性与精确性。

Stagehand

Stagehand 是一款基于自然语言处理的 AI 工具,专注于网页自动化操作。其核心功能包括自然语言驱动的 `act`、`extract` 和 `observe` API,支持原子化指令执行和多模型适配。Stagehand 可实现网页测试、数据抓取、表单操作及内容监控等多样化任务,广泛应用于网页测试、数据分析、办公自动化等领域。

MiniPerplx

MiniPerplx 是一款基于 Grok 2.0 模型的开源 AI 搜索工具,支持网页、视频、学术论文等内容的检索。它提供代码解释、天气查询、URL 摘要、位置搜索等多功能服务,采用 Next.js 和 Vercel AI SDK 构建,具备良好的用户体验。用户可访问 GitHub 自行部署,适用于学术研究、编程开发、新闻获取等多个场景。

Self

Self-Taught Evaluators是一种无需人工标注数据的模型评估框架,通过自我训练方式增强大型语言模型(LLM)的评估能力。其核心在于利用LLM生成对比输出并进行迭代优化,显著提升了模型评估的准确性,达到了与顶级奖励模型相媲美的效果,广泛适用于语言模型开发、内容评估、教育科研以及技术支持等领域。

CogView3

CogView3是一款基于中继扩散技术的开源AI图像生成模型,由清华大学与智谱AI联合研发。它通过分阶段生成图像,从低分辨率逐步提升至高分辨率,提高了生成效率并降低了运行成本。CogView3在生成质量和速度上超越了现有的开源模型SDXL,在保持图像细节的同时大幅减少推理时间。其核心特性包括高性能、多分辨率支持及多种优化技术,适用于艺术创作、数字娱乐、广告营销等多个领域。

OpenScholar

OpenScholar是一款由华盛顿大学与艾伦AI研究所联合研发的检索增强型语言模型,专为科学家设计,能够高效检索并综合海量科学文献信息,生成基于文献的事实性回答。该工具具备强大的跨学科适用性,涵盖计算机科学、生物医学等多个领域,同时支持自我反馈迭代优化,显著提升回答质量和引用可靠性。所有相关资源已完全开源,便于全球学者使用与研究。

SimpleQA

SimpleQA是OpenAI开发的一个基准测试工具,用于评估大型语言模型在回答简短、事实性问题时的表现。它包含4326个问题,每个问题都有唯一的正确答案,并通过严格的验证流程确保质量。SimpleQA不仅能够测试模型的事实性回答能力,还能衡量其自我认知水平和校准能力,广泛应用于模型开发、学术研究及教育工具等领域。