AI模型 - 智狐AI导航

4EVERChat

一个多功能聊天平台，支持不少先进的AI模型。用户能按需挑选，还能同时和多个模型交流。它很注重隐私，能保障用户数据安全。

Ai平台模型 2025年06月05日 34 点赞 0 评论 425 浏览

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型，基于端到端强化学习实现“用图思考”能力，无需依赖监督微调。它在推理过程中动态调用图像工具，增强对细节的感知与理解，在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能，适用于教育、医疗、交通、安防和工业等多个领域。

AI项目与工具 2025年06月11日 21 点赞 0 评论 425 浏览

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型，具备约5.15亿参数量，能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出，支持多种应用场景，包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

AI项目与工具 2025年06月12日 73 点赞 0 评论 426 浏览

Gemini 2.0

Gemini 2.0 是谷歌推出的原生多模态AI模型，具备快速处理文本、音频和图像的能力，支持多语言输出和实时音视频流输入。通过Agent技术和工具调用，Gemini 2.0 能够自主理解任务并提供解决方案，已在编程、数据分析、游戏等领域展示应用潜力。目前提供免费试用，计划逐步开放更多功能。

AI项目与工具 2025年06月12日 63 点赞 0 评论 438 浏览

Aya Vision

Aya Vision 是 Cohere 推出的多模态、多语言视觉模型，支持 23 种语言，具备图像描述生成、视觉问答、文本翻译和多语言摘要生成等能力。采用模块化架构与合成标注技术，确保在资源有限条件下仍具高效表现。适用于教育、内容创作、辅助工具开发及多语言交流等多个场景，具有广泛的实用价值。

AI项目与工具 2025年06月12日 70 点赞 0 评论 439 浏览

Eagle 2.5

Eagle 2.5 是一款由英伟达开发的视觉语言模型，专注于长上下文多模态学习，具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B，但性能接近更大模型。采用信息优先采样和渐进式后训练策略，提升模型稳定性与适应性。支持多样任务，适用于视频分析、图像处理、内容创作及教育等多个领域。

AI项目与工具 2025年06月11日 59 点赞 0 评论 439 浏览

SpeciesNet

SpeciesNet 是 Google 开发的 AI 模型，用于识别相机陷阱图像中的动物物种，支持超过 2000 种标签分类，涵盖动物、分类群及非生物对象。基于 6500 万张图像训练，具备高效数据处理和跨场景识别能力，适用于野生动物监测、生物多样性研究及生态保护。模型开源，可在 GitHub 获取，支持开发人员部署与优化。

AI项目与工具 2025年06月12日 39 点赞 0 评论 447 浏览

源2.0

源2.0-M32是由浪潮信息开发的一种混合专家模型（MoE），包含32个专家，采用“注意力路由器”技术，显著提升了模型的效率和准确性。该模型在代码生成、数学问题解决、科学推理等多个领域表现出色，尤其在ARC-C和MATH基准测试中超越了其他模型。源2.0-M32具有高效的计算能力和广泛的适用性，适用于多种复杂任务。

AI项目与工具 2025年06月12日 31 点赞 0 评论 456 浏览

MobileVD

MobileVD是Qualcomm AI Research团队开发的首个面向移动端优化的视频扩散模型，基于Stable Video Diffusion架构，通过降低帧分辨率、多尺度时间表示和剪枝技术，显著提升模型效率。其具备高效的去噪能力和低资源消耗，适用于短视频生成、视频编辑、游戏动画及互动视频等多种应用场景，为移动设备上的视频生成提供了强大支持。

AI项目与工具 2025年06月12日 61 点赞 0 评论 458 浏览

讯飞星火X1

讯飞星火X1是科大讯飞推出的基于全国产算力平台训练的大型语言模型，具备深度推理和“慢思考”能力，适用于数学、代码、逻辑推理、文本生成等任务。支持快慢思考统一模型，部署简便，算力需求低。广泛应用于教育、医疗、健康管理等领域，提供精准的智能服务与解决方案。

AI项目与工具 2025年06月12日 99 点赞 0 评论 458 浏览

AI模型

首页

AI模型

列表

默认

浏览次数

发布日期