开源工具 - 智狐AI导航

FacePoke

FacePoke是一款基于AI的开源实时面部编辑工具，支持通过简单拖拽操作调整人物头部姿态和面部表情，使静态图像更加生动。其采用深度学习技术，具备高分辨率输出和精确控制能力，适用于数字艺术、内容创作及影视制作等领域。工具基于LivePortrait技术开发，支持本地和Docker部署，便于用户灵活使用。

AI项目与工具 2025年06月12日 86 点赞 0 评论 862 浏览

Wan2.1

Wan2.1是阿里云推出的开源AI视频生成模型，支持文生视频与图生视频，具备复杂运动生成和物理模拟能力。采用因果3D VAE与视频Diffusion Transformer架构，性能卓越，尤其在Vbench评测中表现领先。提供专业版与极速版，适应不同场景需求，已开源并支持多种框架，便于开发与研究。

AI项目与工具 2025年06月12日 47 点赞 0 评论 608 浏览

PhotoDoodle

PhotoDoodle是一种基于少量样本学习的艺术化图像编辑框架，能够精准复现艺术家风格并应用于照片涂鸦。它采用两阶段训练策略，结合位置编码重用和无噪声条件范式，确保生成效果与背景一致。支持装饰元素添加、背景保留、指令驱动编辑等功能，并通过低秩适应技术实现高效风格定制。项目提供高质量数据集和开源资源，适用于数字艺术创作、商业设计、社交媒体等多个场景。

AI项目与工具 2025年06月12日 13 点赞 0 评论 794 浏览

olmOCR

olmOCR 是一款开源 PDF 文档处理工具，结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型，可高效提取结构化文本并保留原始布局。支持多种文档类型，具备大规模批量处理能力和低成本优势，适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

AI项目与工具 2025年06月12日 47 点赞 0 评论 628 浏览

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型，通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练，支持多种参数规模，适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能，并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异，具备良好的可扩展性和零样本适应能力。

AI项目与工具 2025年06月12日 48 点赞 0 评论 704 浏览

WhisperChain

WhisperChain 是一款开源语音识别工具，支持实时语音转文本并提供文本优化功能，可去除填充词、优化语法。用户可通过全局热键快速启动语音输入，处理结果自动复制到剪贴板。支持 Streamlit 界面与 FastAPI 架构，适用于会议记录、写作辅助等场景。

AI项目与工具 2025年06月12日 57 点赞 0 评论 665 浏览

Granite 3.2

Granite 3.2是IBM推出的开源多模态AI模型系列，具备强大的推理、视觉理解和预测能力。其核心功能包括链式推理、多模态融合、稀疏嵌入和时间序列预测，适用于复杂任务自动化、文档理解、安全监控等领域。Granite 3.2通过优化资源利用和安全性设计，提升了模型性能与实用性。

AI项目与工具 2025年06月12日 68 点赞 0 评论 785 浏览

Heygem

Heygem是一款由硅基智能推出的开源数字人模型，支持Windows系统。它可通过1秒视频或照片快速生成数字人形象和声音，30秒内完成克隆，60秒合成4K视频。具备多语言支持、100%口型匹配、低配置运行等优势，适用于内容创作、教育、直播、影视及客服等多个领域，提供高效、低成本的数字人解决方案。

AI项目与工具 2025年06月12日 18 点赞 0 评论 861 浏览

COMET

COMET是字节跳动开发的Mixture-of-Experts（MoE）模型优化系统，通过细粒度计算-通信重叠技术和自适应负载分配机制，显著提升分布式训练效率。它在大规模模型中实现单层1.96倍、端到端1.71倍的加速，具备强鲁棒性与泛化能力，支持多种硬件环境和并行策略，核心代码已开源并可无缝集成至主流训练框架。

AI项目与工具 2025年06月12日 12 点赞 0 评论 880 浏览

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型，支持多语言、多模态处理，具备文本、图像及短视频分析能力。提供多种模型尺寸，适配不同硬件环境，优化了单 GPU/TPU 性能，推理速度提升显著。内置图像安全分类器，增强内容安全性。支持多种开发工具和部署方式，适用于人脸识别、物体检测、智能助手、文本分析等场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 641 浏览

开源工具

首页

开源工具

列表

默认

浏览次数

发布日期