模型 - 智狐AI导航

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型，主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构，集成了视觉和语言信息，通过Siglip视觉编码器和Qwen-2语言模型，实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 752 浏览

PlayDiffusion

PlayDiffusion是Play AI推出的音频编辑模型，基于扩散模型技术实现音频的精细编辑和修复。它将音频编码为离散标记序列，通过掩码处理和去噪生成高质量音频，保持语音连贯性和自然性。支持局部编辑、高效文本到语音合成、动态语音修改等功能，具有非自回归特性，提升生成速度与质量。适用于配音纠错、播客剪辑、实时语音互动等场景。

AI项目与工具 2025年06月11日 94 点赞 0 评论 752 浏览

紫东太初大模型

紫东太初，中科院自动化所和武汉人工智能研究院推出新一代大模型，从三模态走向全模态，支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务，拥有更强的认知、理解、创作能力，带来全新互动体验。

Ai平台模型 2025年06月05日 79 点赞 0 评论 752 浏览

Onit

Onit是一款为Mac设计的AI聊天助手，支持停靠在任何应用程序中。它能通过高亮文本或自动提取当前窗口内容作为上下文，无需复制粘贴。用户可自由切换多种AI模型，如OpenAI、Anthropic等，并支持本地模式以确保数据安全。Onit还提供可定制快捷键、文件上传和代码块支持等功能，适用于代码辅助、内容创作、技术支持等多种场景，提升工作效率和交互体验。

AI项目与工具 2025年06月11日 14 点赞 0 评论 752 浏览

提示精灵小富贵

一个旨在简化并增强为AI模型创建和优化提示词（Prompts）过程的开源项目，会帮你写Prompt提示词的GPTs应用。

GPTs应用 2025年06月05日 27 点赞 0 评论 751 浏览

Imaiger

Imaiger 是一种可让您搜索和生成由AI创建的图像和在线工具。您还可以使用 Imaiger 通过选择不同的样式、颜色和主题来创建自己的图像。

Ai图片处理 2025年06月05日 18 点赞 0 评论 751 浏览

OpenThinker

OpenThinker-32B 是一款由多所高校联合开发的开源推理模型，拥有 328 亿参数和 16,000 token 上下文支持，以高效的数据利用和严格的质量控制著称。模型基于少量数据实现优异性能，适用于数学、科学、代码生成等多种推理任务。全面开源，提供模型权重、代码和数据集，支持研究与开发扩展。

AI项目与工具 2025年06月12日 23 点赞 0 评论 751 浏览

DeepCoder

DeepCoder-14B-Preview 是一款基于 Deepseek-R1-Distilled-Qwen-14B 微调的开源代码生成模型，采用分布式强化学习技术，在 LiveCodeBench 基准上达到 60.6% 准确率。支持多语言代码生成、问题解决、补全优化、测试生成等功能，适用于开发、教育、竞赛等多个场景。项目提供完整训练数据与优化方案，推动 RL 在 LLM 中的应用。

AI项目与工具 2025年06月12日 39 点赞 0 评论 750 浏览

Gemini Diffusion

Gemini Diffusion是谷歌推出的实验性文本扩散模型，通过逐步细化噪声生成文本，具备快速响应、生成更连贯文本和迭代细化等能力。与传统自回归模型不同，它能并行生成文本，提高效率。在外部基准测试中表现优异，速度更快，适用于内容创作、代码生成、数学问题解答和文本编辑等场景。用户需加入等待名单获取访问权限。

AI项目与工具 2025年06月11日 48 点赞 0 评论 750 浏览

小虫快读

小虫快读（BugQR）是一款集成OCR技术和AI大语言模型的高效阅读工具，支持拍照识别、文字提取、核心内容总结及语音播放等功能。其三大总结模式（Summary、Explain、Note）满足多样化阅读需求，适用于学生、教师、研究人员、商业分析人士及法律专业人士等多个领域。免费版提供基础功能，高级版本支持内容导出。

AI项目与工具 2025年06月12日 24 点赞 0 评论 750 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期