开源 - 智狐AI导航

YAYI

YAYI-Ultra是中科闻歌研发的企业级大语言模型，具备多领域专业能力与多模态内容生成能力，支持数学、代码、金融、中医等领域。模型支持超长文本处理、数据分析、任务规划及联网创作，适用于媒体、医疗、财税等行业。采用混合专家架构，结合指令微调技术，在多项评测中表现优异，提供高效、精准的智能化服务。

AI项目与工具 2025年06月12日 25 点赞 0 评论 812 浏览

VectorVein

VectorVein 是一款开源的无代码AI工作流工具，通过简化拖拽操作，使用户无需编程知识即可构建智能工作流，实现日常任务的自动化。它支持数据处理、分析和知识管理等多种应用场景，具备无代码、AI驱动和可定制化等特点。VectorVein 旨在降低AI应用的门槛，提升个人和团队的工作效率，并提供本地部署和开源选项，以满足不同用户的数据安全和隐私需求。

AI项目与工具 2025年06月12日 20 点赞 0 评论 812 浏览

Poetry2Image是一个由哈尔滨工业大学提出的迭代校正框架，专门用于中文古诗词的图像生成。该工具通过自动化反馈和校正机制，提升了诗歌与图像的一致性，解决了文本到图像生成模型在处理中文古典诗歌时常见的关键元素丢失或语义混淆问题。Poetry2Image具备搜索翻译、生成初始图像、提取关键元素、图像修正及迭代优化等功能，与多种图像生成模型结合使用时，其元素完整性和语义一致性表现优异，适用于古诗词

AI项目与工具 2025年06月12日 55 点赞 0 评论 812 浏览

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型，支持40种语言及22种中文方言，具备高精度语音转文字能力。采用CTC-Attention架构，结合E-Branchformer和Transformer技术，提升识别效率与准确性。模型开源，支持自定义语言与地区设置，适用于会议记录、语音输入、智能助手等多种场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 811 浏览

Xiaomi MiMo

Xiaomi MiMo 是小米推出的推理型大模型，具备强大的数学推理与代码生成能力。通过预训练与后训练相结合，利用大量高价值语料及强化学习算法，在 7B 参数规模下实现超越更大模型的表现。支持多场景应用，包括教育、科研、软件开发等，已开源至 HuggingFace，便于开发者使用与研究。

AI项目与工具 2025年06月11日 95 点赞 0 评论 808 浏览

MarkItDown

MarkItDown是一款由微软推出的开源文档转换工具，支持多种文件格式（如PDF、Office文档、图像、音频等）转换为Markdown格式。它具备OCR文字识别、语音转文字、元数据提取等功能，适用于文档归档、内容发布、数据挖掘、学术研究等多个场景，旨在简化文件处理流程，提升工作效率。通过提供简单易用的API接口，MarkItDown成为开发者友好型工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 808 浏览

VideoFusion

VideoFusion 是一款开源的短视频处理工具，支持自动去除黑边、水印和字幕，智能旋转视频方向，提升画质，并兼容多种视频格式。具备批量处理、自定义设置和实时进度反馈功能，适用于视频创作者、自媒体运营及企业等多场景应用。

AI项目与工具 2025年06月12日 27 点赞 0 评论 807 浏览

Sky

Sky-T1是由加州大学伯克利分校NovaSky团队开发的开源推理AI模型，具备高性价比和强大推理能力。其训练成本仅450美元，数据来源经过优化处理，可在数学、编程和科学领域表现出色。模型支持用户从零复现，适用于教育、科研及软件开发等场景。在MATH500和LiveCodeBench测试中，Sky-T1表现优于部分早期OpenAI模型，展现出良好的实用价值。

AI项目与工具 2025年06月12日 12 点赞 0 评论 806 浏览

Bark

Bark是一款开源的文本到音频转换模型，由Suno AI开发，能够生成逼真的多语言语音及多种音频类型，包括音乐和背景噪音，并支持非语言交流的声音。该模型提供预训练模型，适用于研究和商业用途。其主要功能涵盖文本到音频转换、多语言支持、音频多样性和非语言交流模拟。Bark在多语言内容创作、音频内容生成和非语言交流场景中具有广泛应用。

AI项目与工具 2025年06月12日 28 点赞 0 评论 804 浏览

OpenUtau

OpenUtau 是一款开源的歌声合成工具，支持 UTAU 音源库和 VSQX 格式，具备音素编辑、颤音控制、多语言界面等功能，适用于音乐创作与虚拟歌手合成。它兼容 Windows、macOS 和 Linux，提供预渲染与实时预览，提升创作效率，适合音乐人、开发者及音频爱好者使用。

AI项目与工具 2025年06月11日 38 点赞 0 评论 801 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期