模型 - 智狐AI导航

Eagle 2.5

Eagle 2.5 是一款由英伟达开发的视觉语言模型，专注于长上下文多模态学习，具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B，但性能接近更大模型。采用信息优先采样和渐进式后训练策略，提升模型稳定性与适应性。支持多样任务，适用于视频分析、图像处理、内容创作及教育等多个领域。

AI项目与工具 2025年06月11日 59 点赞 0 评论 439 浏览

LongLLaVA是由香港中文大学（深圳）研究团队开发的多模态大型语言模型，结合Mamba和Transformer模块，利用2D池化技术压缩图像token，大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异，特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化，支持多种多模态输入处理，广泛应用于视频分析、医学影像诊断、环境监测等领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 439 浏览

Flex3D

Flex3D是一款由Meta和牛津大学联合研发的两阶段3D生成框架，通过多视图扩散模型和视图筛选机制生成高质量3D模型，支持从文本、单张图片或稀疏视图生成逼真的3D内容。其核心在于基于Transformer架构的灵活重建模型（FlexRM），结合三平面表示与3D高斯绘制技术，实现高效且详细的三维重建，广泛应用于游戏开发、AR/VR、影视制作等领域。

AI项目与工具 2025年06月12日 45 点赞 0 评论 439 浏览

Gemini 2.0

Gemini 2.0 是谷歌推出的原生多模态AI模型，具备快速处理文本、音频和图像的能力，支持多语言输出和实时音视频流输入。通过Agent技术和工具调用，Gemini 2.0 能够自主理解任务并提供解决方案，已在编程、数据分析、游戏等领域展示应用潜力。目前提供免费试用，计划逐步开放更多功能。

AI项目与工具 2025年06月12日 63 点赞 0 评论 438 浏览

Kimi Chat

Kimi Chat 是由月之暗面科技有限公司开发的智能聊天助手，旨在为用户提供高效、智能和友好的交流体验。作为一款先进的人工智能产品，Kimi Chat 集成了多种功能和特点，使其能够满...

Ai平台模型 1970年01月01日 0 点赞 0 评论 437 浏览

DCEdit

DCEdit是一款基于双层控制机制的图像编辑工具，结合精确语义定位策略与视觉、文本自注意力优化，提升图像编辑的准确性和可控性。无需额外训练即可应用于现有扩散模型，支持复杂场景下的精细编辑任务，如对象替换、颜色调整等，适用于广告、影视、社交媒体等多个领域。

AI项目与工具 2025年06月12日 15 点赞 0 评论 436 浏览

Natural Language Playlist

Natural Language Playlist 探索语言和音乐之间丰富而复杂的关系，并使用 Transformer 语言模型构建播放列表。由于没有更好的术语，音乐推荐是一种“闭门造车”的东西。

创作工具 1970年01月01日 0 点赞 0 评论 436 浏览

ClickPrompt

ClickPrompt 是一款专为 Prompt 编写者设计的工具，它支持多种基于 Prompt 的 AI 应用，例如 Stable Diffusion、ChatGPT 和 GitHub Copilot 等。使用 ClickPrompt，您可以轻松地查看、分享和一键运行这些模型，同时提供在线的 Prompt 生成器，使用户能够根据自己的需求轻松创建符合要求的 Prompt，并与其他人分享。

Ai提示指令 2025年06月05日 23 点赞 0 评论 436 浏览

Keble.AI

一个融合AI与数据的平台，能生成亚马逊产品分析报告，还可借助最新Listing模型挖掘新产品机会并生成分析报告，与自训练的 Listing LLM 模型或最新ChatGPT模型聊天。

AI搜索问答 2025年06月05日 56 点赞 0 评论 436 浏览

LLM Engineer Toolkit

一个精心整理的LLM工具库，它将120多个与LLM相关的库按照功能和用途进行了细致分类，涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。

Ai学习资源 2025年06月05日 71 点赞 0 评论 436 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期