应用场景 - 智狐AI导航

SwiftEdit

SwiftEdit是一款基于文本引导的图像编辑框架，利用一步反演技术和掩码引导编辑技术，可在极短时间内实现高质量图像编辑，同时保持背景元素完整。它支持快速文本引导编辑、一步反演框架及自引导编辑掩码提取，并具备灵活的注意力重缩放机制，广泛应用于社交媒体、广告营销、新闻媒体、艺术创作和电子商务等领域。

AI项目与工具 2025年06月12日 53 点赞 0 评论 648 浏览

Large Action Models

Large Action Models（LAMs）是微软开发的一种智能系统框架，专注于执行真实世界任务。它通过整合数据收集、模型训练、环境交互和评估等阶段，将语言理解转化为具体行动，提升了AI在自动化和增强人类能力方面的影响力。LAMs具备动态规划、自主执行和专业化训练等特点，广泛应用于办公自动化、智能家居管理、客户服务、电子商务等领域。 ---

AI项目与工具 2025年06月12日 59 点赞 0 评论 583 浏览

GraphAgent

GraphAgent是一款基于人工智能的知识图谱构建与应用平台，集成了图生成、任务规划及任务执行三大模块，支持从结构化与非结构化数据中提取信息并形成知识图谱，具备自然语言交互、预测分析等功能。它通过图神经网络和大型语言模型实现高效的数据处理与语义理解，适用于学术研究、电商推荐、金融风控等多个领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 780 浏览

ILLUME

ILLUME是一款基于大型语言模型的统一多模态大模型，集成了视觉理解与生成能力，采用“连续图像输入 + 离散图像输出”架构，通过语义视觉分词器和三阶段训练流程，实现了高效的数据利用和多模态任务处理能力。模型能够无缝整合视觉理解与生成功能，广泛应用于视频分析、医疗诊断、自动驾驶及艺术创作等领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 890 浏览

Emotion

Emotion-LLaMA是一款基于多模态输入的情绪识别与推理模型，结合音频、视觉和文本信息，提升情感理解的准确性与可解释性。模型采用改进版LLaMA架构，通过指令调整增强情感处理能力，并依托自建的MERR数据集进行训练与验证。在多个挑战赛中表现优异，适用于人机交互、教育、心理健康、客户服务等领域，具有广泛的应用前景。

AI项目与工具 2025年06月12日 85 点赞 0 评论 614 浏览

CodeWave

CodeWave是网易数帆推出的低代码开发平台，通过智能化手段提升软件开发效率。具备数据模型设计、页面搭建、逻辑与流程设计等核心功能，支持从简单应用到复杂系统的快速构建。平台提供大量标准化组件及扩展能力，满足不同行业和场景的开发需求。可视化设计器让开发过程更直观，降低技术门槛。CodeWave支持应用源码导出和独立部署，确保代码级安全，满足企业对数据隐私和安全的严格要求。

AI项目与工具 2025年06月11日 42 点赞 0 评论 513 浏览

QwenLong

QwenLong-L1-32B是阿里巴巴集团Qwen-Doc团队开源的首个长文本推理大模型，基于渐进式上下文扩展、课程引导的强化学习和难度感知的回顾性采样策略，显著提升长文本场景下的推理能力。该模型在多个DocQA基准测试中表现优异，平均准确率达70.7%，超越多个现有旗舰模型。其功能包括长文本推理、稳定训练、混合奖励、广泛适用性和高性能表现，适用于法律、金融、科研等多个领域。

AI项目与工具 2025年06月11日 24 点赞 0 评论 707 浏览

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型，具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障，并根据自然语言指令识别和跟踪目标对象。无需提前建图，适用于多种场景，如陪伴服务、安防巡逻、物流配送等，为具身智能商业化提供支撑，推动机器人走向日常生活。

AI项目与工具 2025年06月11日 79 点赞 0 评论 769 浏览

VRAG

VRAG-RL是阿里巴巴通义大模型团队推出的视觉感知驱动的多模态RAG推理框架，旨在提升视觉语言模型在处理视觉丰富信息时的检索、推理和理解能力。通过定义视觉感知动作空间，实现从粗粒度到细粒度的信息获取，并结合强化学习和综合奖励机制优化模型性能。该框架支持多轮交互推理，具备良好的可扩展性，适用于智能文档问答、视觉信息检索、多模态内容生成等多种场景。

AI项目与工具 2025年06月11日 84 点赞 0 评论 809 浏览

Firesearch 是 Mendable AI 团队推出的 AI 驱动的深度研究工具，基于 Firecrawl 多源网络内容提取技术和 OpenAI GPT-4o 的搜索规划与内容生成能力，能够将复杂查询分解为子问题进行搜索和内容提取。它支持答案验证、自动重试、实时进度更新、完整引用和上下文记忆等功能，帮助用户高效获取准确、全面的研究结果。工具基于 Next.js 15 构建，提供现代化的开发体

AI项目与工具 2025年06月11日 100 点赞 0 评论 526 浏览

应用场景

首页

应用场景

列表

默认

浏览次数

发布日期