开源 - 智狐AI导航

OpenBMB

OpenBMB作为一个大型的中英文双语基础模型，通过在大规模语料库上的预训练，具备了优秀的语言处理能力。

Ai平台模型 1970年01月01日 0 点赞 0 评论 461 浏览

ImagePulse

ImagePulse是由魔搭社区推出的开源项目，专注于图像理解和生成模型的数据集支持。它通过将复杂任务拆解为“修改、添加、移除”“风格迁移”“人脸保持”等原子能力，构建专门的数据集，提升模型在特定任务上的性能。项目提供开源脚本，支持数据集的生成与扩展，并结合多种技术资源实现多模型协同，适用于艺术创作、视频制作、产品展示等多个领域。

AI项目与工具 2025年06月11日 71 点赞 0 评论 462 浏览

Xyne

一款日常办公工的智能搜索问答工具，Xyne整合了工作中的各种数据，可以高效查找各种文件、邮件、聊天记录、应用工具等数据并智能回答。

AI搜索问答 2025年06月05日 87 点赞 0 评论 463 浏览

II

II-Agent 是一个开源的 Agent 框架，通过与大型语言模型（LLM）交互，简化和提升跨领域的工作流程。其核心功能包括研究与事实核查、内容生成、数据分析与可视化、软件开发、工作流自动化及问题解决等。具备动态上下文提示、智能 token 管理、规划与反思能力、多模态处理以及实时通信等功能。支持 CLI 和 WebSocket 接口，适用于智能客服、金融投顾、医疗诊断和教育辅导等多种场景。

AI项目与工具 2025年06月11日 67 点赞 0 评论 464 浏览

Harmonai

我们是一个社区驱动的组织，发布开源生成音频工具，让每个人都能更轻松、更有趣地制作音乐

创作工具 1970年01月01日 0 点赞 0 评论 466 浏览

Anime gf

一个本地且开源的CharacterAI替代工具，提供了一个用户友好的界面，允许用户在桌面上与虚拟角色互动。你可以自定义创建各种角色，让每个虚拟角色都有自己的独特个性和语言风格。

AI写作对话 2025年06月05日 56 点赞 0 评论 467 浏览

Ruyi

Ruyi是一款基于DiT架构的图生视频大模型，支持多分辨率和多时长的视频生成，具有首帧、首尾帧控制、运动幅度调整及镜头方向控制等功能。它通过Casual VAE模块和Diffusion Transformer实现视频数据的压缩与生成，旨在降低动漫和游戏内容的开发周期和成本。目前，Ruyi-Mini-7B版本已开源。

AI项目与工具 2025年06月12日 17 点赞 0 评论 467 浏览

VideoRAG

VideoRAG是一种基于检索增强生成（RAG）技术的工具，旨在提升长视频的理解能力。它通过提取视频中的多模态信息（如OCR、ASR和对象检测），并将其与视频帧和用户查询结合，增强大型视频语言模型的处理效果。该技术轻量高效，易于集成，适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 468 浏览

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型，采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理，强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本，适用于研究、开发及各类应用场景，展现卓越性能。

AI项目与工具 2025年06月12日 67 点赞 0 评论 468 浏览

Mobvoi MCP Server

Mobvoi MCP Server是出门问问推出的一站式AI工具，集成语音生成、声音克隆、图片驱动数字人、视频配音等多模态能力。用户可通过简单输入文本调用功能，支持多客户端和多场景应用。基于标准化接口和开源生态，提供高效、灵活的数字生产力解决方案，适用于内容创作、虚拟主播、在线教育等多个领域。

AI项目与工具 2025年06月11日 82 点赞 0 评论 468 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期