评估 - 智狐AI导航

FullStack Bench

FullStack Bench是一款由字节跳动与M-A-P社区联合推出的专业代码评估工具，主要针对全栈编程和多语言编程能力进行评估。它包含11种真实编程场景、3374个问题以及16种编程语言，具备全面评估、多语言支持、实际场景模拟、代码质量控制等特点，适用于代码智能评估、教育与培训、研究开发、软件测试及多语言编程能力评估等多个场景。

AI项目与工具 2025年06月12日 40 点赞 0 评论 795 浏览

EvalsOne Ai

一个功能强大而简单易用的一站式评估平台，EvalsOne Ai用于迭代优化生成式AI的应用程序。它可以帮助克服AI生成中的不确定性，简化工作流程，增强团队信心，确保

Ai平台模型 2025年06月05日 38 点赞 0 评论 796 浏览

CAR（Certainty-based Adaptive Reasoning）是字节跳动联合复旦大学推出的自适应推理框架，旨在提升大型语言模型（LLM）和多模态大型语言模型（MLLM）的推理效率与准确性。该框架通过动态切换短答案和长形式推理，根据模型对答案的置信度（PPL）决定是否进行详细推理，从而在保证准确性的同时节省计算资源。CAR适用于视觉问答（VQA）、关键信息提取（KIE）等任务，在数学

AI项目与工具 2025年06月11日 73 点赞 0 评论 803 浏览

CodeGemma

CodeGemma是由Google开发的大型语言模型系列，专注于代码生成和理解。它包含三种不同规模的模型：2B预训练模型、7B预训练模型和7B指令微调模型。CodeGemma支持多种编程语言，能够提供代码补全、生成和自然语言理解等功能。经过大量英语编程和数学数据的训练，CodeGemma具备高准确性，能够在多种编程语言中表现出色，并能集成到各种开发环境中，提高开发效率。

AI项目与工具 2024年01月01日 65 点赞 0 评论 807 浏览

potis.ai

Potis.ai 是一款基于 AI 技术的招聘平台，通过自动化行为面试、智能面试协助和人才评分系统，帮助企业提升招聘效率，降低时间和成本支出。平台支持无缝集成至现有流程，提供详尽的候选人反馈和团队协作优化功能，适用于远程招聘、大规模招聘及技术岗位评估等多种场景。

AI项目与工具 2025年06月12日 63 点赞 0 评论 812 浏览

Collaborative Gym

Collaborative Gym（Co-Gym）是一款支持人机协作的开发框架，具备异步交互、任务环境设计和多维评估功能。它通过模拟与真实环境支持开发者进行高效迭代与实际部署，适用于旅行规划、表格分析和文献综述等多种协作任务，提升人机协作效率与质量。

AI项目与工具 2025年06月12日 22 点赞 0 评论 813 浏览

VE

VE-Bench是北京大学MMCAL团队研发的一款视频编辑质量评估工具，包含数据库（VE-Bench DB）和量化评估模块（VE-Bench QA）。它综合考虑了视觉质量、文本-视频一致性及源视频与编辑后视频的动态关联性，旨在实现与人类感知一致的精准评估。适用于电影制作、短视频优化、广告行业等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 814 浏览

HIRING.STUDIO

HIRING.STUDIO是一款基于AI技术的面试问题生成平台，专注于优化招聘流程。其核心功能包括智能生成职位相关问题、提供后续问题建议、生成评估标准以及支持多种答案评估模式（如STAR方法）。该工具不仅提升了面试准备的效率和一致性，还增强了面试官对候选人的评价客观性，适用于技术面试、行为面试及团队协作场景，尤其适合校园招聘和远程面试等多样化招聘需求。

AI项目与工具 2025年06月12日 25 点赞 0 评论 816 浏览

North

North 是 Cohere 推出的企业级 AI 工作平台，提供安全、高效的 AI 解决方案，支持私有云或本地部署。内置 Compass 搜索系统，可处理多种数据类型并支持多语言，提升任务效率。平台集成了高性能语言模型和自动化工具，适用于金融、医疗等行业，可用于风险评估、客户支持、疾病诊断、药物研发等多个场景，增强企业智能化水平。

AI项目与工具 2025年06月12日 60 点赞 0 评论 820 浏览

Agent K v1.0

Agent K v1.0 是一款端到端自主数据科学智能体，由华为诺亚方舟实验室与伦敦大学学院团队联合开发。该工具能够自动化处理数据科学生命周期中的各个环节，支持多模态数据处理，具备动态多步骤问题解决能力，并通过结构化推理和动态记忆管理实现自我学习与优化。Agent K v1.0 在Kaggle多模态挑战赛中表现优异，广泛应用于金融、医疗、零售、制造及客户服务等领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 821 浏览

评估

首页

评估

列表

默认

浏览次数

发布日期