强化学习 - 智狐AI导航

AutoGLM

AutoGLM-Web是一款基于大型语言模型开发的AI浏览器助手，具备网页浏览、信息检索、内容总结及邮件自动回复等功能。它通过自进化在线课程强化学习框架不断优化性能，支持多场景应用，适用于办公自动化、学术研究、电商运营及客户服务等领域。

AI项目与工具 2025年06月12日 74 点赞 0 评论 634 浏览

ToddlerBot

ToddlerBot是由斯坦福大学开发的开源人形机器人平台，具备30个主动自由度，采用Dynamixel电机，总成本低于6000美元。它支持模拟到现实的零样本迁移，可通过远程操作采集高质量数据，适用于运动控制、强化学习及多机器人协作等研究场景。其高保真数字孪生技术与易维护设计，使其成为科研和教育领域的理想工具。

AI项目与工具 2025年06月12日 15 点赞 0 评论 637 浏览

T2I

T2I-R1是由香港中文大学与上海AI Lab联合开发的文本到图像生成模型，采用双层推理机制（语义级和 Token 级 CoT），实现高质量图像生成与复杂场景理解。其基于 BiCoT-GRPO 强化学习框架，结合多专家奖励模型，提升生成图像的多样性和稳定性。适用于创意设计、内容制作、教育辅助等多个领域，具有广泛的应用潜力。

AI项目与工具 2025年06月11日 63 点赞 0 评论 640 浏览

DianJin

DianJin-R1是由阿里云与苏州大学联合开发的金融领域推理增强型大模型，基于CFLUE、FinQA和CCC等高质量数据集训练，通过监督微调和强化学习优化，提升金融任务的推理能力。模型支持结构化输出，具备高效推理与低计算成本优势，在合规检查、金融问答、考试辅助等领域表现优异，适用于多种金融应用场景。

AI项目与工具 2025年06月11日 68 点赞 0 评论 641 浏览

MARS

MARS是一款由字节跳动开发的优化框架，专注于提升大型模型训练效率。它融合了预条件梯度方法与方差减少技术，并通过缩放随机递归动量技术优化梯度估计。MARS支持多种Hessian近似方式，可生成基于AdamW、Lion和Shampoo的优化算法实例。该框架适用于深度神经网络、大规模语言模型、计算机视觉任务及强化学习等领域，能有效加速模型收敛并提高训练稳定性。

AI项目与工具 2025年06月12日 79 点赞 0 评论 641 浏览

BlockDance

BlockDance是由复旦大学与字节跳动联合开发的扩散模型加速技术，通过识别结构相似的时空特征（STSS）减少冗余计算，提升推理效率达25%-50%。结合强化学习的BlockDance-Ada模块实现动态资源分配，平衡速度与质量。适用于图像、视频生成及实时应用，支持多种模型，兼顾高效与高质，适用于资源受限环境。

AI项目与工具 2025年06月12日 38 点赞 0 评论 641 浏览

FinGPT

FinGPT是一款面向金融领域的开源大语言模型，基于自然语言处理技术，支持情感分析、关系提取、标题分类和命名实体识别等多种金融任务。它采用端到端框架，结合低秩适配（LoRA）和基于股价的强化学习（RLSP），实现高效的数据处理与模型优化。适用于投资分析、市场研究、量化交易等多个场景，具备多语言支持和实时数据分析能力，为金融决策提供智能化解决方案。

AI项目与工具 2025年06月12日 23 点赞 0 评论 642 浏览

DIAMOND

DIAMOND是一款基于扩散模型的强化学习代理，专注于模拟复杂环境以支持代理的学习与决策。它在Atari游戏和3D环境中表现出色，能够捕捉丰富的视觉信息。通过连续潜在变量和优化的去噪步骤，DIAMOND提升了模型的稳定性和效率。其应用场景涵盖游戏AI开发、机器人技术、虚拟现实、教育培训及科学研究等领域。

AI项目与工具 2025年06月12日 62 点赞 0 评论 655 浏览

豆包大模型1.5

豆包大模型1.5是字节跳动推出的高性能AI模型，采用大规模稀疏MoE架构，具备卓越的综合性能和多模态能力。支持文本、语音、图像等多种输入输出方式，适用于智能辅导、情感分析、文本与视频生成等场景。模型训练数据完全自主，性能优于GPT-4o和Claude 3.5 Sonnet等主流模型，且具备成本优势。

AI项目与工具 2025年06月12日 23 点赞 0 评论 657 浏览

O1

O1-CODER是一款由北京交通大学研究团队开发的开源编码工具，专精于编程任务。它通过结合强化学习和蒙特卡洛树搜索技术，实现了从伪代码到完整代码的生成，并通过测试用例生成器和过程奖励模型优化代码质量。该工具支持自动化代码生成、代码质量提升、教育辅助以及软件测试等多种应用场景。

AI项目与工具 2025年06月12日 98 点赞 0 评论 659 浏览

强化学习

首页

强化学习

列表

默认

浏览次数

发布日期