推理

商量智能助手

商汤科技研发的一款基于自然语言处理技术的人工智能大语言模型。它具备强大的语言理解和生成能力,能够高效地解答用户的问题,提供定制化建议,并辅助创作高质量文本。

E2B

E2B 是一款面向 AI 开发者的工具平台,专注于构建自动化云环境,支持多种大型语言模型和 AI 框架。它提供代码解释与执行、沙箱环境、多代理支持等功能,旨在助力开发者高效构建生产级 AI 应用程序,涵盖代码生成、推理和数据分析等领域。

Amazon Bedrock

Amazon Bedrock是一款由AWS推出的完全托管型AI服务平台,集成了多家顶级AI公司的基础模型,支持企业通过单一API访问高性能模型。它提供了从基础模型接入、微调到代理构建的一系列功能,包括检索增强生成(RAG)、自动推理检查及多Agent协作等特性。此外,其模型蒸馏技术能够有效提升效率并降低运行成本,广泛适用于文本生成、虚拟助手、图像生成等多种应用场景。

腾讯混元Turbo S

腾讯混元Turbo S是腾讯推出的高效AI模型,采用Hybrid-Mamba-Transformer架构,提升推理效率并降低计算成本。支持快速响应、多领域推理、内容创作及多模态生成,适用于对话、代码、逻辑推理等场景。兼具短思维链与长思维链能力,性能对标行业领先模型。

KTransformers

KTransformers是一款由清华大学KVCache.AI团队与趋境科技联合开发的开源工具,用于提升大语言模型的推理性能并降低硬件门槛。它支持在24GB显卡上运行671B参数模型,利用MoE架构和异构计算策略实现高效推理,预处理速度达286 tokens/s,推理速度达14 tokens/s。项目提供灵活的模板框架,兼容多种模型,并通过量化和优化技术减少存储需求,适合个人、企业及研究场景使用。

rStar

rStar-Math是由微软亚洲研究院研发的数学推理工具,采用蒙特卡洛树搜索(MCTS)驱动的深度思考机制,使小型语言模型在数学推理方面达到或超越大型模型水平。通过代码增强的推理轨迹生成、过程偏好模型(PPM)训练和四轮自我进化策略,显著提升了模型的准确率与自我反思能力。该工具已在多个数学基准测试中取得优异成绩,适用于教育、科研、金融、工程和数据分析等多个领域。

DistilQwen2.5

DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的轻量级深度推理模型,包含多种参数量级,适用于资源受限环境。它具备高效计算、深度推理和高度适应性,支持文本生成、机器翻译、客户服务等多种任务。通过双阶段训练和认知轨迹适配框架,提升了小模型的推理能力,性能优于同类开源模型。

揽睿星舟

揽睿星舟是一款由翼方健数自主研发的云端AI训推一体化算力平台,提供高性能GPU计算资源、开箱即用的训练与推理环境、丰富的AI工具链及预训练模型,支持多机多卡分布式训练和隐私安全计算,旨在解决AI协作中的安全信任问题并加速AI价值的释放。它包含推理服务、工作空间、星舟API、镜像社区、应用版与专业版等多种功能和服务,适用于模型训练、推理、大模型API服务、隐私安全计算及数据集共享等多个应用场景。

日日新融合大模型

日日新融合大模型(SenseNova)是商汤科技推出的多模态AI系统,支持文本、图像、视频等多种数据的融合处理,具备强大的深度推理与多模态分析能力。该模型在多个权威评测中表现优异,广泛应用于自动驾驶、视频交互、办公教育、金融、园区管理及工业制造等领域,提升了多场景下的智能化水平。

HuggingChat macOS

HuggingChat macOS是一款基于开源语言模型的聊天应用程序,专为macOS平台打造。它支持多款顶级开源大语言模型,具备网络搜索、代码高亮等功能,同时提供模型管理及本地推理引擎支持。这款工具适用于日常交流、信息查询、语言学习、编程辅助及内容创作等多种场景。