开源工具 - 智狐AI导航

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型，能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型（LRM）设计，采用先进的图像编码、三平面NeRF表示及优化训练策略，支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域，具有高效、高精度和广泛适用性的特点。

AI项目与工具 2025年06月12日 80 点赞 0 评论 798 浏览

UIGEN

一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具，能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码

Ai编程建站 2025年06月05日 44 点赞 0 评论 800 浏览

ChatTS

ChatTS-14B 是一款由字节跳动开发的大型语言模型，专为时间序列数据的理解与推理设计，具备 140 亿参数规模。通过合成数据对齐技术提升任务表现，支持自然语言交互，可应用于金融、气象、工业、医疗和运维等多个场景，提供数据分析、预测与诊断功能。模型已开源，便于开发者使用和扩展。

AI项目与工具 2025年06月11日 73 点赞 0 评论 800 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 800 浏览

OpenUtau

OpenUtau 是一款开源的歌声合成工具，支持 UTAU 音源库和 VSQX 格式，具备音素编辑、颤音控制、多语言界面等功能，适用于音乐创作与虚拟歌手合成。它兼容 Windows、macOS 和 Linux，提供预渲染与实时预览，提升创作效率，适合音乐人、开发者及音频爱好者使用。

AI项目与工具 2025年06月11日 38 点赞 0 评论 801 浏览

Sky

Sky-T1是由加州大学伯克利分校NovaSky团队开发的开源推理AI模型，具备高性价比和强大推理能力。其训练成本仅450美元，数据来源经过优化处理，可在数学、编程和科学领域表现出色。模型支持用户从零复现，适用于教育、科研及软件开发等场景。在MATH500和LiveCodeBench测试中，Sky-T1表现优于部分早期OpenAI模型，展现出良好的实用价值。

AI项目与工具 2025年06月12日 12 点赞 0 评论 806 浏览

Xiaomi MiMo

Xiaomi MiMo 是小米推出的推理型大模型，具备强大的数学推理与代码生成能力。通过预训练与后训练相结合，利用大量高价值语料及强化学习算法，在 7B 参数规模下实现超越更大模型的表现。支持多场景应用，包括教育、科研、软件开发等，已开源至 HuggingFace，便于开发者使用与研究。

AI项目与工具 2025年06月11日 95 点赞 0 评论 808 浏览

Oliva

Oliva 是一款基于语音驱动的 RAG 助手，结合 Langchain 和 Qdrant 向量数据库，实现语音指令到结构化数据的实时响应。支持多智能体协作、语义搜索与灵活知识库集成，适用于企业知识库、智能客服、智能家居等多种场景。具备语音识别、实时通信和自然语言处理能力，提升信息获取与交互效率。

AI项目与工具 2025年06月12日 57 点赞 0 评论 815 浏览

NotebookMLX

NotebookMLX 是一款基于 MLX 技术开发的开源工具，支持将 PDF 文档转换为音频播客。它通过 PDF 预处理、播客脚本生成、文本优化以及文本转语音等功能，实现了从 PDF 文件到高质量音频内容的全流程自动化处理，适用于教育、播客创作、有声书制作等多个领域，显著提升了信息传播效率和用户体验。

AI项目与工具 2025年06月12日 70 点赞 0 评论 819 浏览

GPT学术优化

GPT学术优化是一款专为学术研究与写作设计的开源工具，提供论文翻译、代码解析、信息提取、LaTeX校对、论文润色及摘要生成等功能。其模块化设计支持灵活扩展，通过大型语言模型实现高效的语言处理任务，适用于学术研究、教育辅导、项目开发和技术文档撰写等多个场景。

AI项目与工具 2025年06月12日 58 点赞 0 评论 847 浏览

开源工具

首页

开源工具

列表

默认

浏览次数

发布日期