开源 - 智狐AI导航

Wan2.1

Wan2.1是阿里云推出的开源AI视频生成模型，支持文生视频与图生视频，具备复杂运动生成和物理模拟能力。采用因果3D VAE与视频Diffusion Transformer架构，性能卓越，尤其在Vbench评测中表现领先。提供专业版与极速版，适应不同场景需求，已开源并支持多种框架，便于开发与研究。

AI项目与工具 2025年06月12日 47 点赞 0 评论 508 浏览

cobalt

Cobalt是一款开源流媒体下载工具，支持从各大视频网站、社交媒体和音乐平台下载视频、音频和图片。其主要功能包括高分辨率视频下载（最高8K）、多种音频格式支持、字幕自动提取及个性化主题切换。用户可通过网页版或自托管Docker方式使用，无需注册即可操作，适合在线学习、视频编辑、音乐收藏等多种应用场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 506 浏览

Magic Resume

一个现代化的在线简历编辑器，它基于 Next.js 和 Framer Motion 构建，可以让用户能够轻松创建专业的简历。

Ai开源项目 2025年06月05日 81 点赞 0 评论 506 浏览

Arxiv

一款能够一键将arXiv上的论文转换为Markdown格式的浏览器插件，无论该论文呈现的是摘要、PDF版本还是HTML版本。

Ai开源项目 2025年06月05日 100 点赞 0 评论 505 浏览

memobase

Memobase 是一个开源用户记忆系统，专为生成式 AI 应用设计，支持长期用户数据存储与管理。具备时间感知、灵活配置、高效集成与批量处理能力，适用于虚拟助手、教育工具、用户分析等场景。通过结构化用户画像和事件序列管理，提升 AI 的个性化服务能力，支持大规模用户环境下的稳定运行。

AI项目与工具 2025年06月12日 99 点赞 0 评论 505 浏览

JoyCaption

JoyCaption是一款开源图像提示词生成工具，支持多种图像风格和内容类型，具备丰富的生成模式和灵活的提示控制功能。它适用于社交媒体、图像标注、内容创作、视觉辅助及教育等多个场景，能够生成高质量的描述性字幕和提示词，提升图像处理和创作效率。该工具性能优越，且完全免费开放。

AI项目与工具 2025年01月16日 91 点赞 0 评论 505 浏览

Jina Reader

Jina Reader是一款由Jina AI开发的开源工具，专注于将互联网上的HTML网页内容转换为适合大型语言模型处理的纯文本格式。它支持多种内容格式，具备流模式、JSON模式和Alt生成模式等功能，能够高效提取网页核心内容，去除冗余信息，并通过自然语言处理和动态内容处理技术提升文本质量和理解能力。Jina Reader适用于内容聚合、SEO优化、学术研究及个性化推荐等多个领域。

AI项目与工具 2025年06月12日 52 点赞 0 评论 505 浏览

AutoTrain

AutoTrain是一款由Hugging Face开发的无代码平台，支持用户通过上传数据快速创建和部署定制化的AI模型。它涵盖多种机器学习任务，如文本分类、图像识别及表格数据分析，并提供自动化的数据预处理、分布式训练、超参数优化等功能，适用于自然语言处理、计算机视觉等多个领域。其核心优势在于简化了模型训练流程，使非技术人员也能高效构建高质量模型。 ---

AI项目与工具 2025年06月12日 30 点赞 0 评论 505 浏览

Video

Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积（STC）连接器和音频分支，显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 505 浏览

DeepFloyd

DeepFloyd IF是一个强大的文本到图像生成模型，能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术，提供了多种功能，如超分辨率、风格迁移和零样本学习。

Ai绘画生成 1970年01月01日 0 点赞 0 评论 505 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期