开源 - 智狐AI导航

StyleShot

StyleShot 是一个开源的AI图像风格迁移模型，能够实现文本和图像驱动的风格迁移。它利用风格感知编码器和内容融合编码器，捕捉和再现风格细节，生成高质量的风格化图像。主要应用场景包括艺术创作、社交媒体、游戏开发和电影视频制作。

AI项目与工具 2025年06月12日 13 点赞 0 评论 696 浏览

NextChat

NextChat 是一个基于 Next.js 和 Vercel 的开源项目，允许用户将 ChatGPT 等 AI 大模型集成到自己的网页应用中。该工具支持多平台部署，具备一键式部署功能，并提供完整的 Markdown 支持。NextChat 可用于个人助理、客户服务、教育辅导、内容创作和技术支持等多个领域。

AI项目与工具 2025年06月12日 78 点赞 0 评论 524 浏览

MooER

MooER是一款基于国产全功能GPU训练的开源音频理解大模型，由摩尔线程推出。它能够进行中文和英文的语音识别，并具备中译英的语音翻译能力。MooER在Covost2中译英测试集中取得25.2的BLEU分数，接近工业级标准。其主要功能包括语音识别、语音翻译、高效率训练以及开源模型。该模型采用深度学习架构和端到端训练模式，具有强大的多语言处理能力和广泛的适用性。

AI项目与工具 2025年06月12日 41 点赞 0 评论 960 浏览

Bark

Bark是一款开源的文本到音频转换模型，由Suno AI开发，能够生成逼真的多语言语音及多种音频类型，包括音乐和背景噪音，并支持非语言交流的声音。该模型提供预训练模型，适用于研究和商业用途。其主要功能涵盖文本到音频转换、多语言支持、音频多样性和非语言交流模拟。Bark在多语言内容创作、音频内容生成和非语言交流场景中具有广泛应用。

AI项目与工具 2025年06月12日 28 点赞 0 评论 879 浏览

eSearch

eSearch是一款基于Electron框架的开源跨平台AI桌面应用，适用于Linux、Windows和macOS系统。它集成了多种功能，包括快速截屏、OCR文字识别、搜索翻译、屏幕录制和屏幕贴图等。凭借简洁的界面和强大的功能，eSearch显著提高了用户在桌面环境中的工作效率，尤其适合教育、办公自动化、设计和内容创作等领域。

AI项目与工具 2025年06月12日 80 点赞 0 评论 715 浏览

mPLUG

mPLUG-Owl3是一款由阿里巴巴开发的多模态AI模型，专注于理解和处理多图及长视频内容。该模型具备高推理效率和准确性，采用创新的Hyper Attention模块优化视觉与语言信息的融合。它已在多个基准测试中展现出卓越性能，并且其源代码和资源已公开，可供研究和应用。

AI项目与工具 2025年06月12日 73 点赞 0 评论 616 浏览

Omages

Omages是一个开源的3D模型生成项目，基于图像扩散技术将3D形状的几何和纹理信息编码到64×64像素的2D图像中。该工具不仅提高了3D对象生成的效率，还在低分辨率下保留丰富的细节。Omages支持3D对象生成、几何和纹理编码、多图谱表示以及自动材质生成等功能。它适用于3D打印与制造、虚拟现实、增强现实、游戏开发、电影和动画制作及室内设计等多种应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 619 浏览

edge-tts 是一个开源的AI文字转语音项目，支持超过40种语言和300多种声音。该项目利用微软Azure Cognitive Services技术，能够将文本信息转换为流畅自然的语音输出。edge-tts 提供了丰富的语言和声音选择，易于集成且具有高度可定制性。其主要功能包括多语言支持、多样声音选择、流畅自然语音、易于集成的API以及开源特性。edge-tts 广泛应用于辅助技术、客户服务、

AI项目与工具 2025年06月12日 86 点赞 0 评论 699 浏览

LM Studio

LM Studio是一个开源的本地大语言模型（LLM）应用平台，提供图形用户界面（GUI）和命令行界面（CLI），便于用户使用大型语言模型。LM Studio支持从Hugging Face等平台下载兼容的模型文件，并提供了一种“Playground”模式，用户可以通过该模式同时运行多个AI模型，以增强性能和输出。此外，LM Studio还具备模型发现功能，能够在应用首页展示新的和值得关注的LLMs

AI项目与工具 2025年06月12日 42 点赞 0 评论 506 浏览

Video

Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积（STC）连接器和音频分支，显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 584 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期