评估 - 智狐AI导航

Pixian.AI

Pixian.AI是一款基于人工智能的一键抠图工具，特别适合需要快速、高质量处理图片背景的用户。该工具无需订阅，提供高效且经济的解决方案，尤其在Beta测试阶段，用户可以免费使用。...

图片处理 2026年07月28日 0 点赞 0 评论 787 浏览

SciTE AI

一个帮助研究人员发现和理解研究文章的平台，通过展示文章的引用情况来帮助用户了解文章的上下文。

教育学习 2025年06月05日 46 点赞 0 评论 779 浏览

OlympicArena

OlympicArena是由多所高校与研究机构联合开发的多学科认知推理基准测试框架，包含11,163道国际奥赛双语题目，覆盖数学、物理、化学、生物、地理、天文学和计算机科学等7大领域。该平台通过答案级与过程级评估，全面衡量AI模型的逻辑与视觉推理能力，支持多模态输入并具备数据泄漏检测机制，适用于AI模型评估、训练优化、教育辅助及科研应用。

AI项目与工具 2025年06月12日 58 点赞 0 评论 776 浏览

VirSci

VirSci是一款基于大型语言模型（LLMs）的多智能体AI科学研究工具，通过模拟科学家团队合作加速科研创新。其主要功能包括合作者选择、主题讨论、创意生成、新颖性评估、摘要生成及自我审查等，支持从团队组建到科学发现的全流程。VirSci具备强大的自然语言处理能力、数字孪生技术和知识库支持，广泛应用于科学研究、团队协作、教育和项目管理等领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 774 浏览

SmartPrep AI

新一代课程规划简化，释放无限创造力，减少重复性任务，SmartPrep AI让您有更多时间专注于教学！

教育学习 2025年06月05日 11 点赞 0 评论 773 浏览

VideoPhy

VideoPhy是一款由UCLA和谷歌研究院联合开发的基准测试工具，旨在评估视频生成模型的物理常识能力。它包含688条描述性字幕，通过人类和自动评估方式，衡量生成视频是否符合物理规则。VideoPhy不仅揭示了现有模型的不足，还推出了自动评估工具VideoCon-Physics，以推动模型性能的提升。其应用场景广泛，包括视频生成模型开发、计算机视觉研究、教育与培训以及娱乐产业等。

AI项目与工具 2025年06月12日 84 点赞 0 评论 772 浏览

SocioVerse

SocioVerse是由复旦大学等机构联合开发的社会模拟平台，基于大语言模型和1000万真实用户数据构建与现实对齐的模拟环境。系统包含社会环境、用户引擎、场景引擎和行为引擎四大模块，支持多场景应用，如政治选举预测、新闻传播分析、经济调查和政策评估。它能够模拟群体行为，预测事件趋势，为社会科学研究提供高效工具。

AI项目与工具 2025年06月11日 80 点赞 0 评论 766 浏览

WiS

WiS是一个基于“谁是卧底”游戏规则的在线AI竞赛平台，专为评估和分析大型语言模型（LLMs）在多智能体系统中的行为而设计。平台提供统一的模型评估接口、实时排行榜、全面的行为评估功能以及详尽的数据可视化支持，旨在为研究人员和开发者提供一个直观且高效的工具，用于测试和优化智能体在复杂交互环境中的表现。

AI项目与工具 2025年06月12日 20 点赞 0 评论 760 浏览

OmniThink.AI

OmniThink.AI是一款面向零售和消费品行业的AI平台，整合预测性与生成性AI技术，助力企业加速产品设计、营销及供应链管理。平台支持自然语言解释、全球数据模型、多系统集成，并提供可持续性评估与个性化推荐功能，提升运营效率与市场响应速度。

AI项目与工具 2025年06月12日 59 点赞 0 评论 760 浏览

MMRole是一个由中国人民大学高瓴人工智能学院研究团队开发的多模态角色扮演智能体（MRPA）框架。该框架通过整合图像和文本，使智能体能够以特定角色进行更为自然和沉浸式的对话。MMRole框架包括一个大规模、高质量的多模态数据集和一个全面的评估方法，用于开发和评估MRPAs的性能。该框架为创建能够理解和生成与图像相关对话内容的智能体提供了新的可能，并扩展了其在教育、娱乐、客户服务、社交模拟和内容创

AI项目与工具 2025年06月12日 28 点赞 0 评论 752 浏览

评估

首页

评估

列表

默认

浏览次数

发布日期