导航 - 智狐AI导航

AIL

发现最新的人工智能工具、服务、资源，来帮助你完成工作

Ai平台模型 2026年06月27日 0 点赞 0 评论 1102 浏览

Spatial

Spatial-RAG是一种用于增强大型语言模型空间推理能力的框架，融合了稀疏空间检索与密集语义检索技术。它通过多目标优化策略平衡空间约束与语义相关性，生成准确、连贯的自然语言回答。该工具可应用于旅游推荐、智能导航、城市规划、地理问答和物流配送等多个领域，提升了空间数据处理的智能化水平。

AI项目与工具 2025年06月11日 34 点赞 0 评论 888 浏览

VoxInstruct

VoxInstruct是清华大学开源的语音合成技术，能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架，将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略，提升了语音合成的自然度和表现力。它支持多语言和跨语言合成，适用于智能语音助手、有声读物、教育培训等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 875 浏览

Hao123影视

Hao123影视大全为您提供最近好看的电视剧、电影、动漫、综艺节目推荐和排行榜并可在线免费观看，网站分为电视剧、电影、综艺、脱口秀、网络、自制搞笑、少儿、纪录片、视频名站等内容。

影视资源 2025年06月05日 73 点赞 0 评论 869 浏览

ScreenAI

ScreenAI是一款专为理解和处理用户界面（UI）及信息图表而设计的AI视觉语言模型。它能够识别和理解UI元素及其相互关系，并生成与屏幕UI元素相关的文本，如问题回答、UI导航指令和内容摘要。ScreenAI通过多模态编码器结合视觉和语言信息，并采用自回归解码器生成自然语言响应。此外，ScreenAI还能适应不同屏幕格式，提供精确的UI导航和内容摘要功能。

AI项目与工具 2024年01月01日 16 点赞 0 评论 869 浏览

Optimus

Optimus-1是一款由哈尔滨工业大学（深圳）和鹏城实验室联合开发的智能体框架，专为开放世界环境中的长期任务设计。它结合结构化知识与多模态经验，通过混合多模态记忆模块（HDKG与AMEP）提升任务规划与执行能力。主要功能包括知识引导规划、经验驱动反思、行动控制及自我进化，已在游戏、虚拟助理、工业自动化等领域得到验证。

AI项目与工具 2025年06月12日 98 点赞 0 评论 863 浏览

Opera Neon是Opera推出的AI Agent浏览器，基于智能Agent技术重新定义浏览器功能。它支持浏览网页、与用户合作完成任务，如研究主题、自动化工作流程和创建内容。核心功能包括聊天、执行任务和创作内容。用户可通过官网加入等待名单，目前处于邀请制。Opera Neon提供多种应用场景，如旅行规划、金融分析、内容创作、教育研究和任务自动化。其功能涵盖即时答案、研究、内容生成、导航网页完成

AI项目与工具 2025年06月11日 83 点赞 0 评论 852 浏览

千盒工具

一个免费在线工具网站，提供各类简洁好用的优质在线工具。包含图片压缩、图片格式转换、图片编辑识别、视频工具、音频工具、文本工具、数字工具、开发工具、单位转换等

格式转换 2025年06月05日 33 点赞 0 评论 842 浏览

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型，具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障，并根据自然语言指令识别和跟踪目标对象。无需提前建图，适用于多种场景，如陪伴服务、安防巡逻、物流配送等，为具身智能商业化提供支撑，推动机器人走向日常生活。

AI项目与工具 2025年06月11日 79 点赞 0 评论 842 浏览

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型，通过“扩展-压缩”策略优化处理高分辨率图像和长视频，兼具效率与准确性。它在图像和视频基准测试中表现优异，支持时间定位、机器人导航和医疗成像等应用场景，并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

AI项目与工具 2025年06月12日 68 点赞 0 评论 826 浏览

导航

首页

导航

列表

默认

浏览次数

发布日期

AIL