模型 - 智狐AI导航

LLM Engineer Toolkit

一个精心整理的LLM工具库，它将120多个与LLM相关的库按照功能和用途进行了细致分类，涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。

Ai学习资源 2025年06月05日 71 点赞 0 评论 436 浏览

SkyReels Ai

一个由昆仑万维推出的AI短剧平台，集成了视频大模型与3D大模型，能够通过AI一键生成完整剧本、分镜、人物对白与背景音乐，支持角色形象、音色与分镜的自定义调整。

Ai视频生成 2025年06月05日 36 点赞 0 评论 436 浏览

Kimi Chat

Kimi Chat 是由月之暗面科技有限公司开发的智能聊天助手，旨在为用户提供高效、智能和友好的交流体验。作为一款先进的人工智能产品，Kimi Chat 集成了多种功能和特点，使其能够满...

Ai平台模型 1970年01月01日 0 点赞 0 评论 437 浏览

Gemini 2.0

Gemini 2.0 是谷歌推出的原生多模态AI模型，具备快速处理文本、音频和图像的能力，支持多语言输出和实时音视频流输入。通过Agent技术和工具调用，Gemini 2.0 能够自主理解任务并提供解决方案，已在编程、数据分析、游戏等领域展示应用潜力。目前提供免费试用，计划逐步开放更多功能。

AI项目与工具 2025年06月12日 63 点赞 0 评论 438 浏览

AI提示语学习教程

learning prompt，这是一份教你如何更好地使用 ChatGPT 和 Midjourney 免费AI提示语学习教程。

Ai学习资源 2025年06月05日 88 点赞 0 评论 439 浏览

AingDesk

AingDesk 是一款开源的 AI 模型部署工具，支持一键安装上百款 AI 模型，降低使用门槛。具备联网搜索功能，提升回答准确性；提供模型共享与多语言支持，便于团队协作与跨语言使用。内置模型管理器，优化本地资源利用，适用于学习、办公及学术研究等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 439 浏览

Eagle 2.5

Eagle 2.5 是一款由英伟达开发的视觉语言模型，专注于长上下文多模态学习，具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B，但性能接近更大模型。采用信息优先采样和渐进式后训练策略，提升模型稳定性与适应性。支持多样任务，适用于视频分析、图像处理、内容创作及教育等多个领域。

AI项目与工具 2025年06月11日 59 点赞 0 评论 439 浏览

LongLLaVA是由香港中文大学（深圳）研究团队开发的多模态大型语言模型，结合Mamba和Transformer模块，利用2D池化技术压缩图像token，大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异，特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化，支持多种多模态输入处理，广泛应用于视频分析、医学影像诊断、环境监测等领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 439 浏览

Flex3D

Flex3D是一款由Meta和牛津大学联合研发的两阶段3D生成框架，通过多视图扩散模型和视图筛选机制生成高质量3D模型，支持从文本、单张图片或稀疏视图生成逼真的3D内容。其核心在于基于Transformer架构的灵活重建模型（FlexRM），结合三平面表示与3D高斯绘制技术，实现高效且详细的三维重建，广泛应用于游戏开发、AR/VR、影视制作等领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 439 浏览

DreamO

DreamO是由字节跳动与北京大学联合开发的图像定制生成框架，基于扩散变换器（DiT）模型实现多条件图像生成。支持身份、风格、背景等条件的灵活集成，具备高质量生成、条件解耦和精准控制能力。适用于虚拟试穿、风格迁移、主体驱动生成等多种场景，具备广泛的适用性和技术先进性。

AI项目与工具 2025年06月11日 31 点赞 0 评论 440 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期