强化学习 - 智狐AI导航

PaSa

PaSa是由字节跳动研发的基于强化学习的学术论文检索系统，能够模仿人类研究者行为，自动调用搜索引擎、分析论文内容并追踪引文网络，提供精准全面的学术文献检索服务。其核心技术包括Crawler和Selector两个智能体，结合强化学习优化，显著提升了搜索效率与准确率。PaSa适用于学术研究、高校教学、知识产权分析等多个领域，具备高效检索和复杂查询处理能力。

AI项目与工具 2025年06月12日 41 点赞 0 评论 589 浏览

Operator

Operator是由OpenAI开发的AI工具，基于Computer-Using Agent（CUA）模型，能够模拟人类操作网页浏览器，完成如预订、购物、表单填写等任务。它结合了GPT-4o的视觉识别能力和强化学习的推理能力，支持多任务处理和个性化设置。具备自我纠错、安全防护及隐私保护机制，在涉及敏感信息时会请求用户接管。适用于自动化购物、数据分析、日程安排等多种场景。

AI项目与工具 2025年06月12日 10 点赞 0 评论 834 浏览

TeleAI

TeleAI-t1-preview是中国电信人工智能研究院开发的复杂推理大模型，具有强大的数学与逻辑推理能力。它在多项国际评测中表现优异，尤其在数学竞赛和古籍解析方面表现突出。模型融合了强化学习与思考范式，支持从文言文到现代汉语的数学题解析，并具备策略推理与单位换算等功能。该模型即将上线天翼AI开放平台，未来将在教育、科研等领域广泛应用。

AI项目与工具 2025年06月12日 88 点赞 0 评论 868 浏览

Deep Research

Deep Research是由OpenAI开发的一款AI深度搜索与研究工具，支持多步骤自主研究，适用于金融、科学、政策等领域。基于o3模型，结合强化学习技术，能高效整合网络信息并生成结构化研究报告。用户可通过提示词触发研究流程，系统自动生成引用清晰、逻辑严谨的成果，适用于学术研究、市场分析、投资决策等场景。

AI项目与工具 2025年06月12日 21 点赞 0 评论 542 浏览

ASAP

ASAP是一种由卡内基梅隆大学与英伟达联合开发的两阶段框架，用于解决仿人机器人在模拟与现实之间动力学不匹配的问题。它通过预训练阶段在模拟环境中学习运动策略，并在后训练阶段利用真实数据训练Delta动作模型，补偿动力学差异。该框架提高了机器人在复杂任务中的敏捷性、协调性和运动精度，支持多种应用场景，如体育、救援、工业、家庭服务及虚拟现实等，为仿人机器人的实际应用提供了高效的技术方案。

AI项目与工具 2025年06月12日 19 点赞 0 评论 720 浏览

Satori

Satori是一款由MIT和哈佛大学等机构联合开发的7B参数大语言模型，专注于提升推理能力。其采用COAT机制和两阶段训练框架，结合强化学习优化模型性能，具备自回归搜索、数学推理、跨领域任务处理以及自我纠错等核心能力。Satori在数学和逻辑推理任务中表现突出，广泛应用于科研、教育、智能客服等多个领域，代码、数据和模型均已开源。

AI项目与工具 2025年06月12日 79 点赞 0 评论 826 浏览

HUGWBC

HUGWBC是由上海交通大学与上海AI Lab联合开发的人形机器人全身控制器，支持多种自然步态和精细参数调整，具备高鲁棒性和实时外部干预能力。基于强化学习和不对称训练框架，实现从模拟到现实的高效迁移，适用于复杂地形导航、动态任务执行及人机协作等多种场景。

AI项目与工具 2025年06月12日 34 点赞 0 评论 913 浏览

《Manus没有秘密》70页PPT解读AI Agent（PDF文件）

本文详细解读了AI Agent技术从L1到L3的发展历程，涵盖了定义、实现原理、用户体验及未来趋势。文章以Manus为例，探讨了Agent技术的通用性、技术实现路径及用户感知变化，强调了提升通用性、性能和用户体验的重要性。同时，文章提出了对未来发展的期望和建议。

AI项目与工具 2025年06月12日 45 点赞 0 评论 866 浏览

ToddlerBot

ToddlerBot是由斯坦福大学开发的开源人形机器人平台，具备30个主动自由度，采用Dynamixel电机，总成本低于6000美元。它支持模拟到现实的零样本迁移，可通过远程操作采集高质量数据，适用于运动控制、强化学习及多机器人协作等研究场景。其高保真数字孪生技术与易维护设计，使其成为科研和教育领域的理想工具。

AI项目与工具 2025年06月12日 15 点赞 0 评论 719 浏览

SignLLM

SignLLM是一款支持多语言手语生成的AI模型，能将文本转换为自然流畅的手语视频，覆盖包括ASL、GSL、LSA、KSL在内的八种手语。其核心技术包括离散化与层次化表示、自监督学习、符号-文本对齐等。该工具可用于教育、医疗、法律、媒体等多个场景，提升听障人群的沟通便利性与信息获取能力。

AI项目与工具 2025年06月12日 86 点赞 0 评论 866 浏览

强化学习

首页

强化学习

列表

默认

浏览次数

发布日期