CoT

九章大模型(MathGPT)

学而思九章大模型是好未来自主研发的,面向全球数学爱好者和科研机构,以解题和讲题算法为核心的大模型。

MME

MME-CoT 是一个用于评估大型多模态模型链式思维推理能力的基准测试框架,涵盖数学、科学、OCR、逻辑、时空和一般场景六大领域,包含1,130个问题,每题均附关键推理步骤和图像描述。该框架引入推理质量、鲁棒性和效率三大评估指标,全面衡量模型推理能力,并揭示当前模型在反思机制和感知任务上的不足,为模型优化和研究提供重要参考。

HuatuoGPT

HuatuoGPT-o1是一款专为医学领域设计的复杂推理模型,具备强大的复杂推理、错误识别与修正能力。通过两阶段训练方法及强化学习技术,该模型能够生成详尽的推理链条,有效提升医疗问题解决效率。它已在多个医学基准测试中展现出卓越性能,并在医学诊断、个性化治疗方案制定、教育及药物研发等领域具有广泛应用潜力。

DRT

DRT-o1是一套由腾讯研究院开发的基于长链思考推理(CoT)技术的AI翻译模型,专门针对文学作品翻译设计,尤其擅长处理比喻和隐喻等复杂修辞手法。模型通过多智能体框架和迭代优化机制,显著提升了翻译质量和效率,同时具备强大的复杂语言结构处理能力。DRT-o1已在多个应用场景中展现出广泛潜力,包括文学翻译、跨文化交流、教育辅助以及多语言内容创作等领域。

LongRAG

LongRAG是一个专为长文本问答设计的双视角鲁棒检索增强生成框架,包含混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器。它通过整合全局上下文与细节信息,解决长文本中的复杂问答挑战,并在多个数据集上展现优异性能。此外,其自动化微调数据构建能力增强了模型的指令遵循能力和领域适用性。