导航

AIL

发现最新的人工智能工具、服务、资源,来帮助你完成工作

Hao123影视

Hao123影视大全为您提供最近好看的电视剧、电影、动漫、综艺节目推荐和排行榜并可在线免费观看,网站分为电视剧、电影、综艺、脱口秀、网络、自制搞笑、少儿、纪录片、视频名站等内容。

极刻AI搜

一站式的AI聚合搜索引擎工具,囊括了互联网上比较好用的一些支持“搜索”的网站或工具,包括AI搜索、常规搜索、学术搜索、社交搜索等多种搜索类型。

Spatial

Spatial-RAG是一种用于增强大型语言模型空间推理能力的框架,融合了稀疏空间检索与密集语义检索技术。它通过多目标优化策略平衡空间约束与语义相关性,生成准确、连贯的自然语言回答。该工具可应用于旅游推荐、智能导航、城市规划、地理问答和物流配送等多个领域,提升了空间数据处理的智能化水平。

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型,具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障,并根据自然语言指令识别和跟踪目标对象。无需提前建图,适用于多种场景,如陪伴服务、安防巡逻、物流配送等,为具身智能商业化提供支撑,推动机器人走向日常生活。

VoxInstruct

VoxInstruct是清华大学开源的语音合成技术,能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架,将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略,提升了语音合成的自然度和表现力。它支持多语言和跨语言合成,适用于智能语音助手、有声读物、教育培训等多个领域。

Optimus

Optimus-1是一款由哈尔滨工业大学(深圳)和鹏城实验室联合开发的智能体框架,专为开放世界环境中的长期任务设计。它结合结构化知识与多模态经验,通过混合多模态记忆模块(HDKG与AMEP)提升任务规划与执行能力。主要功能包括知识引导规划、经验驱动反思、行动控制及自我进化,已在游戏、虚拟助理、工业自动化等领域得到验证。

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型,通过“扩展-压缩”策略优化处理高分辨率图像和长视频,兼具效率与准确性。它在图像和视频基准测试中表现优异,支持时间定位、机器人导航和医疗成像等应用场景,并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

HiPPTER

PPT设计提供创意灵感、配色方案、免费图片、优质图标、工具插件

千盒工具

一个免费在线工具网站,提供各类简洁好用的优质在线工具。包含图片压缩、图片格式转换、图片编辑识别、视频工具、音频工具、文本工具、数字工具、开发工具、单位转换等