推理 - 智狐AI导航

SearchAgent

SearchAgent-X是由南开大学和伊利诺伊大学厄巴纳香槟分校（UIUC）研究人员开发的高效推理框架，旨在提升基于大型语言模型（LLM）的搜索Agent效率。通过高召回率的近似检索、优先级感知调度和无停顿检索等技术，显著提高系统吞吐量（1.3至3.4倍），降低延迟（降至原来的1/1.7至1/5），同时保持生成质量。该框架优化资源利用率，适用于智能客服、搜索引擎、企业知识管理等多种场景，为复杂A

AI项目与工具 2025年06月11日 56 点赞 0 评论 651 浏览

QVQ

QVQ是一个基于Qwen2-VL-72B的开源多模态推理模型，擅长处理文本、图像等多模态数据，具备强大的视觉理解和复杂问题解决能力。它在数学和科学领域的视觉推理任务中表现出色，但在实际应用中仍需解决语言切换、递归推理及图像细节关注等问题。QVQ可广泛应用于教育、自动驾驶、医疗图像分析、安全监控及客户服务等领域。

AI项目与工具 2025年06月12日 70 点赞 0 评论 649 浏览

MedRAX

MedRAX是一款面向胸部X光检查的医学推理AI系统，结合多模态大模型与专业工具，实现复杂医疗问题的动态处理。支持多步骤推理、精准诊断与多种影像分析功能，适用于临床支持、教育培训及远程医疗等场景。系统具备良好的扩展性与部署灵活性，已在多项基准测试中表现优异。

AI项目与工具 2025年06月12日 68 点赞 0 评论 649 浏览

DistriFusion

DistriFusion是一个专为加速高分辨率扩散模型在多GPU环境中生成图像的分布式并行推理框架。通过将图像分割成多个小块并分配至不同设备上进行独立处理，它能够在不增加额外训练负担的情况下，将推理速度提升高达六倍，同时保持图像质量。其技术原理包括Patch Parallelism（分片并行）、异步通信、位移补丁并行性等，适用于多种现有的扩散模型。应用场景包括AI艺术创作、游戏和电影制作、VR/A

AI项目与工具 2025年06月12日 50 点赞 0 评论 647 浏览

OpenAI 12天发布会内容全记录，一文快速捕捉亮点信息

OpenAI举办为期12天的系列发布活动，推出包括强化微调技术、Sora视频生成工具、ChatGPT Canvas和高级语音模式在内的多项创新功能，涵盖推理模型、搜索升级和跨平台集成，显著提升AI工具的性能与应用范围。

AI项目与工具 2025年06月12日 61 点赞 0 评论 646 浏览

Kimi

Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型，支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器，具备强大的图像感知、数学推理和OCR能力。在长上下文（128K）和复杂任务中表现优异，尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 645 浏览

T2V

T2V-Turbo 是一种高效的文本到视频生成模型，能够快速生成高质量视频，同时确保文本与视频的高度一致性。它通过一致性蒸馏技术和混合奖励机制优化生成过程，适用于电影制作、新闻报道、教育及营销等多个领域，支持从创意草图到成品视频的全流程加速。

AI项目与工具 2025年06月12日 16 点赞 0 评论 643 浏览

Math24o

Math24o 是 SuperCLUE 开源的高中奥林匹克数学竞赛级别数学推理测评基准，基于 2024 年全国高中数学竞赛预赛试题，包含 21 道高难度解答题。评测通过程序自动判断答案一致性，客观评估模型正确率。支持自动化评估流程，适用于教育、学术研究和模型优化等领域，为数学推理能力的提升提供重要工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 639 浏览

LayerSkip

LayerSkip 是一种针对大型语言模型推理优化的技术，通过层 dropout 和早期退出损失机制，实现从早期层的精准退出，降低计算成本并提高解码效率。该方法结合自我推测解码技术，支持模型在早期层生成预测并通过后续层验证修正，广泛适用于文档摘要、编程任务、语义解析等自然语言处理任务，同时确保高精度与低延迟。

AI项目与工具 2025年06月12日 72 点赞 0 评论 639 浏览

53AI

一个开箱即用的企业大模型应用平台，只要帮助企业快速部署和利用大型语言模型（LLMs），提供企业大模型落地应用、业务智能化改造、私有模型定制和大模型咨询服务。

AI服务商 2025年06月05日 17 点赞 0 评论 638 浏览

推理

首页

推理

列表

默认

浏览次数

发布日期