开源 - 智狐AI导航

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目，包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识，支持超过50种语言；CosyVoice则专注于自然语音生成，支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景，其相关模型和代码已公开发布。

AI项目与工具 2025年06月12日 66 点赞 0 评论 626 浏览

StyleShot

StyleShot 是一个开源的AI图像风格迁移模型，能够实现文本和图像驱动的风格迁移。它利用风格感知编码器和内容融合编码器，捕捉和再现风格细节，生成高质量的风格化图像。主要应用场景包括艺术创作、社交媒体、游戏开发和电影视频制作。

AI项目与工具 2025年06月12日 13 点赞 0 评论 626 浏览

AnythingLLM

AnythingLLM 是一款开源、多模态的 AI 客户端工具，支持文本、图像和音频输入，可将文档转化为上下文信息供语言模型使用。支持本地和云端部署，具备多用户管理、工作区隔离、丰富的文档格式支持和强大的 API 接口。适用于企业知识管理、学术研究、个人学习、内容创作等多种场景，保障数据隐私安全。

AI项目与工具 2025年06月12日 37 点赞 0 评论 627 浏览

Open Avatar Chat

Open Avatar Chat是阿里开源的模块化实时数字人对话系统，支持低延迟交互与多模态输入输出。系统采用模块化架构，允许灵活配置语音识别、语言模型和语音合成等组件，兼容本地与云服务。支持2D/3D数字人渲染，适用于客户服务、教育、娱乐及企业应用等多个场景，为开发者提供高效、灵活的AI对话解决方案。

AI项目与工具 2025年06月11日 81 点赞 0 评论 628 浏览