应用场景

多面AI面试

一款全自动AI面试评价系统,多面为企业提供招聘过程中对人才的管理、科学的甄别、AI提效的招聘需求。

Yoit.Style

一个时尚AI搜索引擎,Yoit允许用户通过描述、图片或两者的方式将无法搜索的时尚物品变得可搜索。

链企AI

由浙江链企智能技术有限公司推出的AI商业搜索工具, 链企AI提供企业信息、招投标、知识产权等多维度的商业查询服务,通过自研的大模型技术,帮助用户快速、准确地获取全面的商业信息。

Firesearch

Firesearch 是 Mendable AI 团队推出的 AI 驱动的深度研究工具,基于 Firecrawl 多源网络内容提取技术和 OpenAI GPT-4o 的搜索规划与内容生成能力,能够将复杂查询分解为子问题进行搜索和内容提取。它支持答案验证、自动重试、实时进度更新、完整引用和上下文记忆等功能,帮助用户高效获取准确、全面的研究结果。工具基于 Next.js 15 构建,提供现代化的开发体

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架,旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间,实现从粗粒度到细粒度的信息获取,并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理,具备良好的可扩展性,适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型,具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障,并根据自然语言指令识别和跟踪目标对象。无需提前建图,适用于多种场景,如陪伴服务、安防巡逻、物流配送等,为具身智能商业化提供支撑,推动机器人走向日常生活。

QwenLong

QwenLong-L1-32B是阿里巴巴集团Qwen-Doc团队开源的首个长文本推理大模型,基于渐进式上下文扩展、课程引导的强化学习和难度感知的回顾性采样策略,显著提升长文本场景下的推理能力。该模型在多个DocQA基准测试中表现优异,平均准确率达70.7%,超越多个现有旗舰模型。其功能包括长文本推理、稳定训练、混合奖励、广泛适用性和高性能表现,适用于法律、金融、科研等多个领域。

CodeWave

CodeWave是网易数帆推出的低代码开发平台,通过智能化手段提升软件开发效率。具备数据模型设计、页面搭建、逻辑与流程设计等核心功能,支持从简单应用到复杂系统的快速构建。平台提供大量标准化组件及扩展能力,满足不同行业和场景的开发需求。可视化设计器让开发过程更直观,降低技术门槛。CodeWave支持应用源码导出和独立部署,确保代码级安全,满足企业对数据隐私和安全的严格要求。

Emotion

Emotion-LLaMA是一款基于多模态输入的情绪识别与推理模型,结合音频、视觉和文本信息,提升情感理解的准确性与可解释性。模型采用改进版LLaMA架构,通过指令调整增强情感处理能力,并依托自建的MERR数据集进行训练与验证。在多个挑战赛中表现优异,适用于人机交互、教育、心理健康、客户服务等领域,具有广泛的应用前景。

ILLUME

ILLUME是一款基于大型语言模型的统一多模态大模型,集成了视觉理解与生成能力,采用“连续图像输入 + 离散图像输出”架构,通过语义视觉分词器和三阶段训练流程,实现了高效的数据利用和多模态任务处理能力。模型能够无缝整合视觉理解与生成功能,广泛应用于视频分析、医疗诊断、自动驾驶及艺术创作等领域。