题解 - 智狐AI导航

GPT Pilot

GPT Pilot是一款AI编程工具，旨在通过模拟人类开发者的工作流程，帮助从零开始构建应用程序。它能够编写代码、调试程序、与用户讨论问题，并请求代码审查，是真正的AI开发者伙伴。GPT Pilot支持多种运行方式，包括VS Code扩展、命令行工具和Docker容器，使开发者能够在熟悉的环境中提升开发效率。其主要功能包括全功能代码生成、交互式问题解答、高度集成的开发环境、逐步开发、任务分配、开发

AI项目与工具 2025年06月12日 43 点赞 0 评论 569 浏览

xbench

xbench是红杉中国推出的AI基准测试工具，采用双轨评估体系，追踪模型的理论能力上限与实际落地价值。其长青评估机制动态更新测试内容，确保时效性。xbench包含科学问题解答和中文互联网深度搜索两个核心评估集，按季度或每月更新题目。工具还提供垂直领域智能体评测、实时更新与LeaderBoard功能，适用于模型能力评估、真实效用量化、产品迭代指导等场景，推动AI系统在真实场景中的效用提升。

AI项目与工具 2025年06月11日 33 点赞 0 评论 584 浏览

QVQ

QVQ是一个基于Qwen2-VL-72B的开源多模态推理模型，擅长处理文本、图像等多模态数据，具备强大的视觉理解和复杂问题解决能力。它在数学和科学领域的视觉推理任务中表现出色，但在实际应用中仍需解决语言切换、递归推理及图像细节关注等问题。QVQ可广泛应用于教育、自动驾驶、医疗图像分析、安全监控及客户服务等领域。

AI项目与工具 2025年06月12日 70 点赞 0 评论 600 浏览

PlanGEN

PlanGEN 是谷歌研发的多智能体协作框架，用于解决复杂问题的规划与推理。它包含约束、验证和选择三大智能体，支持多智能体协作、约束引导、算法自适应选择等功能。提供四种实现方式，适用于不同复杂度任务，如日程安排、数学证明、自动驾驶等。具有模型不可知性，可与多种大语言模型结合，具备良好的可扩展性和灵活性。

AI项目与工具 2025年06月12日 35 点赞 0 评论 611 浏览