AI项目与工具

馆长

馆长是一款基于RAG技术的浏览器插件式AI问答工具，支持本地知识库管理，可导入PDF、Word、网页等内容，通过语义搜索提供精准答案。所有数据存储于本地，保障隐私安全，支持离线使用。具备中英文搜索、无限文档导入、多平台集成等特性，适用于个人知识管理、企业内部知识库、在线学习及图书馆服务等场景。

AI项目与工具 2025年06月12日 88 点赞 0 评论 586 浏览

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具，用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎，支持 100 多种语言，具备图像优化、纠偏、清洁等功能，提升识别准确率。支持多核处理与批量操作，适合高效处理大量文件，且完全离线运行，保障数据安全。

AI项目与工具 2025年06月12日 39 点赞 0 评论 594 浏览

GameFactory

GameFactory 是由香港大学与快手科技联合研发的AI框架，专注于解决游戏视频生成中的场景泛化问题。它基于预训练视频扩散模型，结合开放域数据与高质量游戏数据，通过多阶段训练实现动作可控的多样化场景生成。具备高精度动作控制、交互式视频生成及丰富场景支持，适用于游戏开发、自动驾驶模拟及具身智能研究等领域。

AI项目与工具 2025年06月12日 31 点赞 0 评论 602 浏览

Memory Layers

Memory Layers是一种由Meta研发的技术，通过引入可训练的键值查找机制，为模型增加了额外参数而不增加计算负担。它通过稀疏激活模式补充计算密集型前馈层，显著提升了模型在事实性任务中的表现，同时增强了模型的记忆与知识获取能力。Memory Layers的核心优势在于其高效的信息存储与检索机制，并且在问答、语言模型、推荐系统、知识图谱及对话系统等场景中具有广泛应用前景。

AI项目与工具 2025年06月12日 82 点赞 0 评论 836 浏览

k1 视觉思考模型

K1视觉思考模型是一款基于强化学习的AI工具，支持端到端图像理解和思维链技术，适用于数学、物理、化学等基础科学领域。该模型可直接处理图像信息并生成推理思维链，具有优秀的字符识别能力和跨学科问题解决能力，广泛应用于教育、科研、艺术等领域。

AI项目与工具 2025年06月12日 65 点赞 0 评论 858 浏览

Find3D

Find3D是一款由加州理工学院开发的3D部件分割模型，通过自动化数据生成技术和对比学习方法，实现了高效且精准的3D对象分割。它能够在多个数据集上达到三倍于次优方法的性能提升，支持开放世界下的任意文本查询分割，广泛应用于机器人、虚拟现实、建筑设计等领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 780 浏览

JanusFlow

JanusFlow是一款集成了自回归语言模型与校正流技术的多模态AI模型，能够在单一框架内高效完成图像理解和生成任务。它通过解耦视觉编码器和表示对齐策略，显著提升了模型在视觉理解与图像生成上的表现，广泛应用于图像生成、多模态内容创作、视觉问答、图像理解和辅助设计等多个领域。

AI项目与工具 2025年06月12日 20 点赞 0 评论 636 浏览

炉米Lumi

炉米Lumi是一款由字节跳动开发的AIGC图像创作平台，主要功能包括模型上传与展示、工作流搭建以及LoRA微调。它为AI爱好者、研究人员和开发者提供了一个协作环境，用于分享和优化AI模型。炉米Lumi支持多种应用场景，如科研、教育、艺术创作、商业应用开发等，具有开放性和高灵活性。 ---

AI项目与工具 2025年06月12日 64 点赞 0 评论 846 浏览

ToolBaz

ToolBaz 是一款多功能的 AI 创作平台，涵盖文章撰写、故事生成、图像与视频制作、语音合成及代码编写等功能，旨在通过人工智能技术简化创作过程，提升内容质量和效率。无论是营销文案、社交媒体帖子还是产品描述，ToolBaz 都能快速生成高质量的结果，同时支持跨领域应用，如品牌宣传、客户服务和教育培训等。

AI项目与工具 2025年06月12日 14 点赞 0 评论 690 浏览

NeMo

NeMo 是一款基于 NVIDIA 技术的端到端云原生框架，专为生成式 AI 模型的设计与部署而打造。它具备模块化架构、多模态支持、优化算法及分布式训练能力，可应用于语音识别、自然语言处理、文本到语音转换、对话式 AI 等多个领域，同时支持预训练模型微调和端到端开发流程，为企业提供高效灵活的解决方案。

AI项目与工具 2025年06月12日 38 点赞 0 评论 806 浏览

AI项目与工具 默认 浏览次数 发布时间

AI项目与工具

默认

浏览次数

发布时间