模型部署 - 智狐AI导航

VideoLLaMA3

VideoLLaMA3 是阿里巴巴开发的多模态基础模型，支持视频与图像的深度理解和分析。基于 Qwen 2.5 架构，结合先进视觉编码器与语言生成能力，具备高效时空建模与多语言处理能力。适用于视频内容分析、视觉问答、字幕生成等场景，提供多种参数版本，支持灵活部署。

AI项目与工具 2025年06月12日 87 点赞 0 评论 410 浏览

DL4J

DL4J开源的使用JVM部署和训练...

Ai编程建站 1970年01月01日 0 点赞 0 评论 418 浏览

AingDesk

AingDesk 是一款开源的 AI 模型部署工具，支持一键安装上百款 AI 模型，降低使用门槛。具备联网搜索功能，提升回答准确性；提供模型共享与多语言支持，便于团队协作与跨语言使用。内置模型管理器，优化本地资源利用，适用于学习、办公及学术研究等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 431 浏览

讯飞星火X1

讯飞星火X1是科大讯飞推出的基于全国产算力平台训练的大型语言模型，具备深度推理和“慢思考”能力，适用于数学、代码、逻辑推理、文本生成等任务。支持快慢思考统一模型，部署简便，算力需求低。广泛应用于教育、医疗、健康管理等领域，提供精准的智能服务与解决方案。

AI项目与工具 2025年06月12日 99 点赞 0 评论 455 浏览

LitServe

LitServe是一款基于FastAPI的高性能AI模型部署引擎，专为企业级AI服务设计。它支持批处理、流式处理和GPU自动扩展，简化了模型部署流程。LitServe易于安装和使用，提供灵活的API定义和强大的服务器控制能力。它兼容多种机器学习框架，具备自动扩展和身份验证等高级特性，适用于机器学习模型部署、大语言模型服务、视觉模型推理、音频和语音处理及自然语言处理等多个领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 486 浏览

InternVL3

InternVL3是上海人工智能实验室推出的多模态大型语言模型，具备文本、图像、视频等多模态数据处理能力。采用原生多模态预训练方法，提升语言与视觉理解效率，并支持工具使用、3D视觉、工业图像分析等复杂任务。模型可通过API部署，适用于智能交互、图像识别、视频分析及客服系统等多种场景。

AI项目与工具 2025年06月11日 68 点赞 0 评论 495 浏览

SmolDocling

SmolDocling-256M-preview 是一款轻量级多模态文档处理模型，能将图像文档高效转换为结构化文本，支持文本、公式、图表等多种元素识别。模型参数量仅256M，推理速度快，适合学术与技术文档处理。具备OCR、布局识别、格式导出等功能，并兼容Docling，适用于文档数字化、科学研究及移动环境应用。

AI项目与工具 2025年03月22日 98 点赞 0 评论 518 浏览

欧派算力云

欧派算力云是一家提供AI算力服务的平台，主要功能包括大模型API接口、GPU容器实例和Serverless服务。其核心技术涵盖分布式算力网络与自研推理加速引擎，显著提升模型推理性能并降低成本。平台支持多模态模型调用，适用于AI推理、训练、云渲染及元宇宙等场景，提供灵活计费与自动化管理功能，助力企业高效部署AI应用。

AI项目与工具 2025年06月11日 97 点赞 0 评论 536 浏览

赤兔Chitu

Chitu（赤兔）是清华大学与清程极智联合开发的高性能大模型推理引擎，支持多种GPU及国产芯片，打破对特定硬件的依赖。其具备全场景部署能力，支持低延迟、高吞吐、小显存优化，并在性能上优于部分国外框架。适用于金融风控、智能客服、医疗诊断、交通优化和科研等领域，提供高效、稳定的推理解决方案。

AI项目与工具 2025年06月12日 25 点赞 0 评论 545 浏览

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型，支持多语言、多模态处理，具备文本、图像及短视频分析能力。提供多种模型尺寸，适配不同硬件环境，优化了单 GPU/TPU 性能，推理速度提升显著。内置图像安全分类器，增强内容安全性。支持多种开发工具和部署方式，适用于人脸识别、物体检测、智能助手、文本分析等场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 557 浏览

模型部署

首页

模型部署

列表

默认

浏览次数

发布日期