评估 - 智狐AI导航

WorldScore

WorldScore是由斯坦福大学推出的统一世界生成模型评估基准，支持3D、4D、图像到视频（I2V）和文本到视频（T2V）等多种模态。它从可控性、质量和动态性三个维度进行评估，涵盖3000个测试样本，包括静态与动态、室内与室外、逼真与风格化等多种场景。WorldScore具备多场景生成、长序列支持、图像条件生成、多风格适配等功能，适用于图像到视频、图像到3D生成以及自动驾驶场景模拟等应用，为研究

AI项目与工具 2025年06月12日 87 点赞 0 评论 929 浏览

Self

Self-Taught Evaluators是一种无需人工标注数据的模型评估框架，通过自我训练方式增强大型语言模型（LLM）的评估能力。其核心在于利用LLM生成对比输出并进行迭代优化，显著提升了模型评估的准确性，达到了与顶级奖励模型相媲美的效果，广泛适用于语言模型开发、内容评估、教育科研以及技术支持等领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 931 浏览

Sky

Sky-T1是由加州大学伯克利分校NovaSky团队开发的开源推理AI模型，具备高性价比和强大推理能力。其训练成本仅450美元，数据来源经过优化处理，可在数学、编程和科学领域表现出色。模型支持用户从零复现，适用于教育、科研及软件开发等场景。在MATH500和LiveCodeBench测试中，Sky-T1表现优于部分早期OpenAI模型，展现出良好的实用价值。

AI项目与工具 2025年06月12日 12 点赞 0 评论 945 浏览

TryOffAnyone

TryOffAnyone是一款基于Latent Diffusion Models技术的AI工具，专注于从人物照片中提取服装区域并生成平铺展示图。它具备在线图片处理、智能服装识别、背景去除和图像优化等功能，广泛应用于电商平台的商品展示、个性化推荐、库存管理和图像检索等领域，帮助提升用户体验和运营效率。

AI项目与工具 2025年06月12日 41 点赞 0 评论 948 浏览

微点

Abit是一款基于生成式大语言模型的智能考试系统，可将文本内容转化为多样化考题，支持多种题型生成、即时评分、考试报告分析及个性化学习建议等功能，广泛应用于企业培训、知识考核等领域，助力提升学习效率与培训效果。

AI项目与工具 2025年06月12日 31 点赞 0 评论 953 浏览

LalaEval

LalaEval是由香港中文大学与货拉拉数据科学团队联合开发的针对特定领域大语言模型的人类评估框架。它提供了一套完整的端到端评估流程，涵盖领域界定、能力指标构建、评测集生成、标准制定及结果分析。通过争议度与评分波动分析，有效减少主观误差，提升评估质量。该工具已在物流领域成功应用，并具备良好的跨领域扩展性，适用于企业内部模型优化与多场景评测。

AI项目与工具 2025年06月12日 29 点赞 0 评论 956 浏览

AgentSociety

AgentSociety是由清华大学开发的基于大语言模型的社会模拟平台，通过构建具有“类人心智”的智能体，模拟复杂的社会行为与现象。平台支持城市环境建模、大规模社会模拟和科研工具集成，适用于社会舆论传播、政策评估、社会极化分析及灾害响应研究。其技术特点包括异步模拟架构、分布式计算和MQTT通信，具备高度可扩展性和实时交互能力。

AI项目与工具 2025年06月12日 21 点赞 0 评论 960 浏览

知闻AI

一个基于AI的新闻聚合平台，只要为用户提供经过筛选和整理的高质量新闻内容，知闻AI通过分析大量新闻源，过滤掉低质量或不可信的信息，确保用户获取到的是准确、及时的新闻。

媒体资讯 2025年06月05日 67 点赞 0 评论 961 浏览

OmniEdit

OmniEdit是一款基于多专家模型监督训练的先进图像编辑工具，支持七种核心图像编辑任务，包括对象替换、移除、添加、属性修改、背景替换、环境变化和风格转换。它能够处理不同宽高比和分辨率的图像，采用EditNet架构，提升了编辑的成功率和图像保真度。OmniEdit在自动与人工评估中表现优异，适用于专业设计、社交媒体内容创作、电子商务、新闻媒体等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 966 浏览

方便面AI面试

AI面试工具是企业智能化招聘的解决方案，支持全球候选人通过微信小程序或浏览器参与结构化初筛面试。具备智能画像、语义分析、表情识别等功能，从能力适配度、文化匹配度和领导力潜质三方面评估候选人。支持多岗位、多语言、多时区接入，与主流招聘系统无缝对接，提升招聘效率与精准度，适用于全球化、校园、远程及中高端人才招聘场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 976 浏览

评估

首页

评估

列表

默认

浏览次数

发布日期