模型 - 智狐AI导航

Ultravox

Ultravox 是一种多模态大型语言模型（LLM），能够直接处理文本和语音输入，无需额外的语音识别步骤。其核心技术包括多模态投影器，用于将音频数据转换为高维空间表示，显著提升语音理解和处理效率。该模型支持实时语音对话、多语言扩展及领域特定知识的学习，适用于智能客服、虚拟助手、语言学习、实时翻译及教育等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 773 浏览

AgentSquare

AgentSquare是一款由清华大学团队研发的模块化设计工具，专注于在大型语言模型代理的设计空间内实现高效搜索。其核心功能包括模块化设计、模块重组与进化、性能预测及自动化搜索等，通过标准化接口支持模块间无缝集成，广泛应用于客户服务、个人助理、教育、医疗及金融等多个领域，旨在提升智能体性能并降低推理成本。

AI项目与工具 2025年06月12日 39 点赞 0 评论 773 浏览

Ai PDF

Ai PDF 是一款强大的工具，可在GPTs平台上运行，旨在有效管理和操作 PDF 文件。它可以处理很大尺寸的PDF文档，Ai PDF的开发重点是提高用户满意度和生产力，无需重复上传文件。

GPTs应用 2025年06月05日 15 点赞 0 评论 772 浏览

DiffuEraser

DiffuEraser是一款基于稳定扩散模型的视频修复工具，具备未知像素生成、已知像素传播、时间一致性维护等功能。通过集成运动模块和优化网络架构，它能有效提升视频修复质量，减少噪声和幻觉。适用于影视后期制作、老电影修复、监控视频增强等多个领域，支持高精度和高连贯性的视频内容修复与增强。

AI项目与工具 2025年06月12日 98 点赞 0 评论 772 浏览

ChatLaw

ChatLaw是一款针对中文法律领域的大型语言模型，它通过定制化的设计和智能分析功能，为法律专业人士提供了一个强大的工具。

Ai平台模型 1970年01月01日 0 点赞 0 评论 772 浏览

Tensor.Art

Tensor.Art 是一款基于 AI 技术的图像生成平台，支持用户通过文字描述生成高质量图像。平台提供多种模型类型，支持模型共享、在线运行及训练，并拥有 ControlNet、图像到图像等功能。Tensor.Art 构建了活跃的创作者社区，适用于艺术创作、广告设计、教育等多个领域，为用户提供便捷高效的图像生成解决方案。

AI项目与工具 2025年06月12日 23 点赞 0 评论 772 浏览

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型，具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障，并根据自然语言指令识别和跟踪目标对象。无需提前建图，适用于多种场景，如陪伴服务、安防巡逻、物流配送等，为具身智能商业化提供支撑，推动机器人走向日常生活。

AI项目与工具 2025年06月11日 79 点赞 0 评论 772 浏览

TinyR1

TinyR1-Preview是由北京大学与360公司联合研发的32B参数推理模型，采用“分治-融合”策略，通过智能融合数学、编程、科学领域的子模型，实现高性能表现。其在数学领域（如AIME）表现优异，仅用5%参数量即可达到原版R1模型95%以上的性能。模型轻量且高效，适用于教育、科研、开发及企业等多种场景，具备良好的部署灵活性与实用性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 771 浏览

PartCrafter

PartCrafter是一款先进的3D生成模型，能够从单张RGB图像中生成多个语义明确且几何形态各异的3D网格。通过组合潜在空间表示每个3D部件，并利用层次化注意力机制确保全局一致性。该模型基于预训练的3D网格扩散变换器（DiT），支持多部件联合生成、端到端生成和部件级编辑，适用于游戏开发、建筑设计、影视制作等多个领域。

AI项目与工具 2025年06月11日 66 点赞 0 评论 771 浏览

Google AI Edge Gallery

Google AI Edge Gallery 是谷歌推出的实验性应用，支持在 Android 设备上本地运行机器学习和生成式人工智能模型，无需联网。用户可切换不同模型，进行图像问答、文本生成、多轮对话等操作，并实时查看性能指标。应用支持自带模型测试，提供丰富的开发者资源，助力探索设备端 AI 的强大功能。

AI项目与工具 2025年06月11日 75 点赞 0 评论 771 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期