开源 - 智狐AI导航

Aligner

Aligner是由北京大学团队开发的大语言模型对齐工具，通过学习对齐答案与未对齐答案之间的差异来提升模型性能。采用自回归seq2seq结构，在Q-A-C数据集上训练，无需RLHF流程。具备高效、灵活、即插即用等特点，支持多模型兼容，提升模型帮助性和安全性。适用于多轮对话、价值观对齐及MoE架构优化等场景。

AI项目与工具 2025年06月12日 44 点赞 0 评论 455 浏览

ReHiFace

ReHiFace-S是一款由硅基智能团队开发的开源AI项目，专注于高保真、实时的人脸替换。该算法具备无需数据训练、高保真度换脸、支持多目标人脸替换、色彩矫正、一键快速部署、Gradio交互界面及支持ONNX格式等特点。ReHiFace-S适用于娱乐、影视制作、VR/AR等多个领域，具有实时处理能力、零样本推理、改进的人脸分割模型等功能。

AI项目与工具 2025年06月12日 97 点赞 0 评论 456 浏览

PDFtoChat

PDFtoChat 是一款基于 AI 技术的开源工具，支持用户通过自然语言对话与 PDF 文件交互。它具备强大的文档解析、智能检索和即时反馈能力，广泛应用于学术研究、法律咨询、商业分析、教育培训和技术文档查询等领域，显著提升文档处理效率。

AI项目与工具 2025年06月12日 69 点赞 0 评论 456 浏览

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具，基于超10万小时播客数据训练，支持零样本语音合成与说话人适配，可在0.33秒内生成1秒音频，适合实时与长内容合成。支持本地部署与API调用，应用于播客、有声书、视频配音、AI角色及新闻播报等领域，兼具高效性与灵活性。

AI项目与工具 2025年06月11日 94 点赞 0 评论 456 浏览

Chatterbox是Resemble AI推出的开源文本转语音（TTS）模型，基于0.5B规模的LLaMA架构，用超过50万小时精选音频训练。它支持零样本语音克隆，仅需5秒参考音频即可生成高度逼真的个性化语音，并具备情感夸张控制功能，可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力，延迟低至200毫秒以下，适用于交互式应用。此外，它采用安全水印技术防止滥用，适用于内容

AI项目与工具 2025年06月11日 55 点赞 0 评论 456 浏览

Granite 4.0 Tiny Preview

Granite 4.0 Tiny Preview是IBM推出的轻量级语言模型，具备高效计算能力和紧凑结构，支持在消费级GPU上运行多个长上下文任务。采用混合Mamba-2/Transformer架构，结合高效与精准优势，支持无位置编码（NoPE）处理128K tokens上下文。内存需求降低72%，推理时仅激活1B参数，适用于边缘设备部署、长文本分析及企业级应用开发，适合资源受限环境下的AI研究与

AI项目与工具 2025年06月11日 42 点赞 0 评论 457 浏览

Pyecharts

pyecharts-gallery是什么？pyecharts-gallery 是一个基于 pyecharts 的开源项目，它通过模仿 ECharts 官方示例，

Ai办公效率 2025年06月05日 67 点赞 0 评论 458 浏览

Stablecog

Stablecog 是一款基于人工智能技术的开源图像生成工具，能够根据文本描述或现有图片生成逼真的艺术作品。它支持多种艺术风格，具备图像编辑和调整功能，适用于艺术创作、设计、社交媒体内容制作等多个领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 459 浏览

OSAID 1.0

OSAID 1.0是由Open Source Initiative（OSI）制定的开源AI标准，明确了AI系统成为开源所需的条件。该标准要求AI系统提供代码、数据和参数，并强调透明度与协作，适用于开源社区、企业、开发者、教育机构及政策制定者。它推动了AI领域的创新、透明度和信任建设，同时影响了现有AI模型的开发和法律地位。

AI项目与工具 2025年06月12日 94 点赞 0 评论 459 浏览

OuteTTS

OuteTTS是一款基于开源技术的文本到语音（TTS）工具，利用纯语言建模方法生成自然语音。它支持语音克隆和自定义说话人声音，具备音频标记化、CTC强制对齐和结构化提示创建等功能。OuteTTS与llama.cpp和GGUF格式兼容，适用于有声读物、智能客服、语音导航等多种应用场景。

AI项目与工具 2025年06月12日 36 点赞 0 评论 460 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期