开源 - 智狐AI导航

Video

Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积（STC）连接器和音频分支，显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 509 浏览

StableV2V是一款基于文本、草图和图片输入的开源视频编辑工具，利用Prompted First-frame Editor（PFE）、Iterative Shape Aligner（ISA）和Conditional Image-to-video Generator（CIG）三大模块，实现视频中物体的精准编辑与替换，同时保持编辑内容与原始视频在动作和深度信息上的高度一致性，适用于电影制作、教育、

AI项目与工具 2025年06月12日 21 点赞 0 评论 510 浏览

Wren AI

Wren AI 是一个开源的文本到 SQL 工具，基于自然语言处理技术，允许用户通过自然语言提问来执行数据库查询，无需编写 SQL 代码。它支持多种数据库和数据源，具有语义理解能力，能准确解析业务上下文并提供精确的结果。Wren AI 的核心功能包括语义引擎、向量数据库和大型语言模型，支持数据集成、安全性和结果导出，广泛应用于业务智能分析、数据探索、报告生成等领域。

AI项目与工具 2025年06月12日 82 点赞 0 评论 510 浏览

PiliPala

一款基于Flutter开发的B站开源第三方客户端。支持Android和iOS平台，提供无广告的高清视频播放体验，具备倍速播放、离线缓存、稍后再看等功能。

Ai开源项目 2025年06月05日 22 点赞 0 评论 511 浏览

SwiftChat

一款基于React Native开发的快速、安全、跨平台聊天应用，支持实时流式聊天功能和Markdown语法，还可以生成AI图像，兼容DeepSeek、Amazon Bedrock、Ollama和OpenAI等模型。

Ai开源项目 2025年06月05日 44 点赞 0 评论 511 浏览

Cody Former

一个开源的人工智能图像处理工具，Cody Former专注于面部修复、图片清晰化以及视频去除马赛克和修复。

Ai图片处理 2025年06月05日 37 点赞 0 评论 511 浏览

Awesome Chinese LLM

整理了开源的中文大语言模型（LLM），主要关注规模较小、可私有化部署且训练成本较低的模型，目前已收录了100多个相关资源。

Ai学习资源 2025年06月05日 44 点赞 0 评论 511 浏览

Zonos

Zonos是一款由Zyphra开发的高保真文本到语音（TTS）模型，支持零样本语音克隆和多语言生成，具备精细的情感与语音参数控制能力。其采用Transformer和SSM混合架构，基于大规模语音数据训练，适用于有声读物、虚拟助手、多媒体创作及无障碍技术等多个领域。模型开源且支持实时语音生成，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 513 浏览

Awesome MCP Servers

Awesome MCP Servers 是一个开源项目，整合了超过 3000 个基于 Model Context Protocol (MCP) 的服务器资源，覆盖浏览器自动化、金融、游戏、安全、科研等多个领域。它支持本地和云部署，提供丰富的开发工具和社区支持，使 AI 模型能够高效调用外部数据和服务，提升应用灵活性与功能性。

AI项目与工具 2025年06月12日 74 点赞 0 评论 513 浏览

乾元BigBangTransformer

BBT-2-12B-Text基于中文700亿tokens进行预训练，经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练。

Ai平台模型 1970年01月01日 0 点赞 0 评论 513 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期