模型 - 智狐AI导航

Outspeed

Outspeed 是一个专注于实时语音和视频 AI 应用开发的平台，提供强大的流媒体处理、低延迟推理、即时部署等功能，支持企业级合规标准。其核心特性包括灵活的模型定制、全面的 SDK 支持以及高效的应用监控工具，广泛应用于客户服务、教育、医疗保健、娱乐、安全监控和质量控制等领域。

AI项目与工具 2025年06月12日 41 点赞 0 评论 889 浏览

PartGen

PartGen是一款基于多视图扩散模型的3D对象生成与重建工具，可从文本、图像或现有3D模型生成由意义明确部分组成的三维对象。它具备自动部分分割、3D重建及基于文本指令的部分编辑等功能，广泛应用于3D打印、游戏开发、影视制作等领域，显著提升工作效率并优化用户体验。

AI项目与工具 2025年06月12日 74 点赞 0 评论 889 浏览

SPAR3D

SPAR3D是一种基于两阶段设计的单图像3D重建工具，能从单张2D图像生成高质量的3D网格。它结合点扩散模型与三平面Transformer技术，实现快速、精确的几何与纹理重建，并支持用户交互式编辑。适用于增强现实、影视制作、工业设计等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 890 浏览

LineArt

LineArt是一种无需训练的高质量设计绘图外观迁移框架，能将复杂外观特征准确转移到设计图纸上，同时保留结构细节。其技术基于模拟人类视觉认知过程，结合艺术经验指导扩散模型，支持工业设计、室内设计、服装设计等多个领域应用。具备高效、高保真和易用性等特点，适用于快速生成逼真效果和优化设计流程。

AI项目与工具 2025年06月12日 34 点赞 0 评论 890 浏览

DeepFaceLab

DeepFaceLab 是一种利用深度学习识别来交换图片和视频中的人脸的工具。

Ai开源项目 2025年06月05日 59 点赞 0 评论 890 浏览

MeshPad

MeshPad 是一款基于草图输入的交互式 3D 网格生成与编辑工具，可将二维草图快速转化为高质量三维模型并支持实时修改。采用三角形序列表示和 Transformer 模型，实现高效、精准的网格生成与调整。通过推测性预测策略，提升计算效率，缩短编辑时间。生成的网格在精度上优于现有方法，适用于艺术设计、建筑设计和工业设计等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 891 浏览

MaxKB

MaxKB是一款开源AI知识库问答系统，支持文档上传、在线文档爬取、文本自动拆分和向量化。它兼容多种大语言模型，包括本地私有和公共模型，提供灵活的工作流引擎和多格式文档支持。MaxKB采用先进的技术如大型预训练语言模型、自动化文档处理、检索增强生成（RAG）技术和向量数据库技术，适用于企业内部知识库、客户服务、教育与培训等多个领域。

AI项目与工具 2025年06月12日 94 点赞 0 评论 891 浏览

CCI 3.0

CCI 3.0是一项由智源研究院开发的大规模中文互联网语料库，包含1000GB主数据集及498GB高质量子集。该语料库覆盖新闻、社交媒体、博客等领域，数据规模较前代扩大近一倍，来源增至20余家机构。通过多维度标注与数据清洗技术，CCI 3.0筛选出高价值数据，适用于自然语言处理、大模型训练、知识图谱构建、内容推荐系统以及教育科研等多种应用场景。

AI项目与工具 2025年06月12日 16 点赞 0 评论 891 浏览

Ultravox

Ultravox 是一种多模态大型语言模型（LLM），能够直接处理文本和语音输入，无需额外的语音识别步骤。其核心技术包括多模态投影器，用于将音频数据转换为高维空间表示，显著提升语音理解和处理效率。该模型支持实时语音对话、多语言扩展及领域特定知识的学习，适用于智能客服、虚拟助手、语言学习、实时翻译及教育等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 891 浏览

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型，具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障，并根据自然语言指令识别和跟踪目标对象。无需提前建图，适用于多种场景，如陪伴服务、安防巡逻、物流配送等，为具身智能商业化提供支撑，推动机器人走向日常生活。

AI项目与工具 2025年06月11日 79 点赞 0 评论 891 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期