评估 - 智狐AI导航

VE

VE-Bench是北京大学MMCAL团队研发的一款视频编辑质量评估工具，包含数据库（VE-Bench DB）和量化评估模块（VE-Bench QA）。它综合考虑了视觉质量、文本-视频一致性及源视频与编辑后视频的动态关联性，旨在实现与人类感知一致的精准评估。适用于电影制作、短视频优化、广告行业等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 814 浏览

Collaborative Gym

Collaborative Gym（Co-Gym）是一款支持人机协作的开发框架，具备异步交互、任务环境设计和多维评估功能。它通过模拟与真实环境支持开发者进行高效迭代与实际部署，适用于旅行规划、表格分析和文献综述等多种协作任务，提升人机协作效率与质量。

AI项目与工具 2025年06月12日 22 点赞 0 评论 813 浏览

potis.ai

Potis.ai 是一款基于 AI 技术的招聘平台，通过自动化行为面试、智能面试协助和人才评分系统，帮助企业提升招聘效率，降低时间和成本支出。平台支持无缝集成至现有流程，提供详尽的候选人反馈和团队协作优化功能，适用于远程招聘、大规模招聘及技术岗位评估等多种场景。

AI项目与工具 2025年06月12日 63 点赞 0 评论 812 浏览

CodeGemma

CodeGemma是由Google开发的大型语言模型系列，专注于代码生成和理解。它包含三种不同规模的模型：2B预训练模型、7B预训练模型和7B指令微调模型。CodeGemma支持多种编程语言，能够提供代码补全、生成和自然语言理解等功能。经过大量英语编程和数学数据的训练，CodeGemma具备高准确性，能够在多种编程语言中表现出色，并能集成到各种开发环境中，提高开发效率。

AI项目与工具 2024年01月01日 65 点赞 0 评论 807 浏览

CAR（Certainty-based Adaptive Reasoning）是字节跳动联合复旦大学推出的自适应推理框架，旨在提升大型语言模型（LLM）和多模态大型语言模型（MLLM）的推理效率与准确性。该框架通过动态切换短答案和长形式推理，根据模型对答案的置信度（PPL）决定是否进行详细推理，从而在保证准确性的同时节省计算资源。CAR适用于视觉问答（VQA）、关键信息提取（KIE）等任务，在数学

AI项目与工具 2025年06月11日 73 点赞 0 评论 803 浏览

EvalsOne Ai

一个功能强大而简单易用的一站式评估平台，EvalsOne Ai用于迭代优化生成式AI的应用程序。它可以帮助克服AI生成中的不确定性，简化工作流程，增强团队信心，确保

Ai平台模型 2025年06月05日 38 点赞 0 评论 796 浏览

FullStack Bench

FullStack Bench是一款由字节跳动与M-A-P社区联合推出的专业代码评估工具，主要针对全栈编程和多语言编程能力进行评估。它包含11种真实编程场景、3374个问题以及16种编程语言，具备全面评估、多语言支持、实际场景模拟、代码质量控制等特点，适用于代码智能评估、教育与培训、研究开发、软件测试及多语言编程能力评估等多个场景。

AI项目与工具 2025年06月12日 40 点赞 0 评论 795 浏览

PaperBench

PaperBench是OpenAI开发的AI智能体评测基准，用于评估其复现顶级机器学习论文的能力。它涵盖从理解论文、编写代码到执行实验的全流程，具备8316个评分节点和自动评分系统。支持多种智能体配置，提供标准化测试环境，适用于模型优化、学术验证及教育实践等领域，推动AI研究的标准化发展。

AI项目与工具 2025年06月12日 31 点赞 0 评论 794 浏览

HMA

HMA（Heterogeneous Masked Autoregression）是一种基于异构预训练和掩码自回归技术的机器人动作视频建模方法，支持离散与连续生成模式，可处理不同动作空间的异构性。该工具具备高效实时交互能力，广泛应用于视频模拟、策略评估、合成数据生成及模仿学习等领域，适用于机器人学习与控制任务，提升策略泛化与执行效率。

AI项目与工具 2025年06月12日 22 点赞 0 评论 790 浏览

Stocknear

Stocknear是一款利用AI技术的在线股票分析平台，提供股票评级、价格预测、市场情绪分析、财务数据展示及技术图表分析等功能。它能够帮助投资者深入了解股票市场动态，辅助其做出更明智的投资决策。Stocknear特别适合个人投资者、市场研究人员以及新手投资者使用，支持从基础学习到专业操作的多样化需求。 ---

AI项目与工具 2025年06月12日 42 点赞 0 评论 789 浏览

评估

首页

评估

列表

默认

浏览次数

发布日期

VE