开源工具 - 智狐AI导航

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型，结合Whisper编码器与Qwen2 LLM，支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略，提升模型泛化能力和稳定性。基于约5万小时语音数据训练，性能优异，适用于智能客服、教育、心理健康监测等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 741 浏览

流畅阅读

FluentRead 是一款开源的浏览器翻译插件，基于AI技术提供精准、自然的翻译服务。支持多种翻译引擎和双语对照显示，具备隐私保护和高度定制化功能。适用于学术研究、工作场景、语言学习及日常阅读，兼容主流浏览器，保障用户数据安全。其开源特性增强了透明度与灵活性，满足多样化翻译需求。

AI项目与工具 2025年06月12日 68 点赞 0 评论 785 浏览

Aider

Aider 是一款开源 AI 编程辅助工具，支持多语言开发，集成多种大型语言模型，通过命令行实现代码编辑、自动提交和多文件处理。具备语音编程、图片交互等功能，提升开发效率。适用于新项目搭建、代码修复、重构及团队协作，支持与主流 IDE 集成，提供流畅的开发体验。

AI项目与工具 2025年06月12日 83 点赞 0 评论 618 浏览

We0

We0是一款开源AI代码编辑器，支持在浏览器中运行和调试代码，具备高保真设计还原功能，能将设计稿还原度提升至90%。兼容Vue、React、Next.js、Python、Java等主流开发框架，支持历史项目导入与微信小程序开发，适用于快速构建和部署AI应用。提供多平台支持，适合开发人员和产品经理高效协作。

AI项目与工具 2025年06月12日 10 点赞 0 评论 704 浏览

NPOA

NPOA是一款开源的舆情监测工具，支持实时数据采集、情感分析、话题分类及多渠道媒体分析，适用于企业品牌管理、政府舆论监控、市场研究等多个领域。系统提供预警机制、可视化报告和大屏展示功能，便于用户快速获取关键信息并做出应对。

AI项目与工具 2025年06月12日 60 点赞 0 评论 649 浏览

OpenThinker

OpenThinker-32B 是一款由多所高校联合开发的开源推理模型，拥有 328 亿参数和 16,000 token 上下文支持，以高效的数据利用和严格的质量控制著称。模型基于少量数据实现优异性能，适用于数学、科学、代码生成等多种推理任务。全面开源，提供模型权重、代码和数据集，支持研究与开发扩展。

AI项目与工具 2025年06月12日 23 点赞 0 评论 749 浏览

LangBot

LangBot 是一款开源的多平台即时通讯机器人，支持多种主流通信工具及大语言模型。具备多模态交互、多轮对话、插件扩展和安全管理等功能，适用于企业客服、个人助理、社区管理、教育辅导和内容创作等场景，提供灵活、安全的自动化服务。

AI项目与工具 2025年06月12日 18 点赞 0 评论 523 浏览

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别（ASR）模型系列，支持普通话、中文方言和英语，具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本，分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色，且已开源，推动语音识别技术的发展。

AI项目与工具 2025年06月12日 82 点赞 0 评论 671 浏览

Hibiki

Hibiki是一款由Kyutai Labs开发的开源语音翻译解码器，支持实时语音到语音（S2ST）和语音到文本（S2TT）的翻译。其基于多流语言模型架构，结合弱监督学习和上下文对齐技术，实现低延迟、高保真度的翻译效果。适用于国际会议、在线教育、旅游、新闻采访及客户服务等场景，具备良好的实用性和可扩展性。

AI项目与工具 2025年06月12日 31 点赞 0 评论 612 浏览

Lumina

Lumina-Image 2.0 是一款开源图像生成模型，基于扩散模型与 Transformer 架构，具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像，支持中英文提示词，并具备强大的复杂提示理解能力。模型支持多种推理求解器，适用于艺术创作、摄影风格图像生成及逻辑推理场景，兼具高效性和灵活性。

AI项目与工具 2025年06月12日 27 点赞 0 评论 752 浏览

开源工具

首页

开源工具

列表

默认

浏览次数

发布日期