梯度估计

首页

梯度估计

列表

默认

浏览次数

发布日期

LaTRO

LaTRO（Latent Reasoning Optimization）是一种用于提升大型语言模型推理能力的框架，通过将推理过程视为潜在分布采样并采用变分推断方法进行优化，无需外部反馈即可增强模型生成高质量推理路径的能力。该框架支持自奖励机制、联合学习及梯度估计等技术，广泛应用于数学问题求解、科学问题解答、编程任务、逻辑推理以及自然语言理解等领域，有助于构建更智能、更自主的问题解决系统。

AI项目与工具 2025年06月12日 45 点赞 0 评论 560 浏览

梯度估计 首页 梯度估计

列表 默认 浏览次数 发布日期

LaTRO

梯度估计

首页

梯度估计

列表

默认

浏览次数

发布日期