开源 - 智狐AI导航

AskCodi

AskCodi 是一个 AI 代码助手，可帮助您更快地编写代码并减少工作量，更快、更好地构建项目，AskCodi为代码生成、单元测试创建、文档编制、代码转换等提供了各种应用程序。

Ai编程建站 2025年06月05日 54 点赞 0 评论 557 浏览

FaceFusion

FaceFusion是一款开源AI工具，支持图像和视频中的人脸交换与增强。其主要功能包括高质量的人脸交换、人脸增强、整体画面优化、唇形同步、多模型人脸检测及遮挡处理。通过深度学习技术，FaceFusion能够实现精准的人脸识别与对齐，广泛应用于电影制作、虚拟主播、广告营销及教育培训等领域。

AI项目与工具 2025年06月12日 80 点赞 0 评论 557 浏览

AIGCPanel

AIGCPanel是一款开源的AI数字人系统，支持视频合成、声音合成与声音克隆等功能。它利用自然语言处理、计算机视觉技术和深度学习算法，实现高质量的音视频同步和自然语音生成。系统具有多语言支持、模型管理和日志查看功能，可应用于影视制作、虚拟主播、教育培训等多个领域。

AI项目与工具 2025年06月12日 69 点赞 0 评论 557 浏览

TeleChat2-115B是一款由中国电信人工智能研究院开发的大型语言模型，具备强大的文本生成能力。它支持多语言处理，包括中文和英文，并且能够高效执行多种任务，如文本生成、代码编写、数据分析和语言翻译等。此外，TeleChat2-115B通过先进的架构设计，如Decoder-only结构和Rotary Embedding位置编码方法，提升了模型性能与稳定性。该模型适用于智能客服、内容创作、教育辅

AI项目与工具 2025年06月12日 23 点赞 0 评论 558 浏览

EXAONE 3.5

EXAONE 3.5是一款由LG AI研究院开发的开源AI模型，包含多种参数规模版本，专长于长文本处理和复杂场景下的推理任务。其核心技术包括检索增强生成与多步推理，可显著减少错误信息并提升准确性。此外，EXAONE 3.5还具备双语支持及强大的上下文理解能力，适用于聊天机器人、语言翻译、内容创作等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 558 浏览

olmOCR

olmOCR 是一款开源 PDF 文档处理工具，结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型，可高效提取结构化文本并保留原始布局。支持多种文档类型，具备大规模批量处理能力和低成本优势，适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

AI项目与工具 2025年06月12日 47 点赞 0 评论 559 浏览

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型，支持多语言、多模态处理，具备文本、图像及短视频分析能力。提供多种模型尺寸，适配不同硬件环境，优化了单 GPU/TPU 性能，推理速度提升显著。内置图像安全分类器，增强内容安全性。支持多种开发工具和部署方式，适用于人脸识别、物体检测、智能助手、文本分析等场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 559 浏览

Deforum

一款开源免费软件工具，一种基于Stable Diffusion的动画生成工具，它可以根据文本描述或参考视频生成连续的图像序列，并将它们拼接在一起以创建视频。

Ai视频生成 2025年06月05日 51 点赞 0 评论 560 浏览

StarVector

StarVector 是一个开源多模态视觉语言模型，支持图像和文本到可编辑 SVG 文件的转换。采用多模态架构，结合图像编码与语言模型，生成结构紧凑、语义丰富的 SVG 内容。基于 SVG-Stack 数据集训练，适用于图标设计、艺术创作、数据可视化等多种场景，具备良好的性能和扩展性。

AI项目与工具 2025年06月12日 68 点赞 0 评论 560 浏览

Vision Parse

Vision Parse 是一款开源工具，旨在通过视觉语言模型将 PDF 文件转换为 Markdown 格式。它具备智能识别和提取 PDF 内容的能力，包括文本和表格，并能保持原有格式与结构。此外，Vision Parse 支持多种视觉语言模型，确保解析的高精度与高速度。其应用场景广泛，涵盖学术研究、法律文件处理、技术支持文档以及电子书制作等领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 561 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期