开源 - 智狐AI导航

GarDiff

GarDiff是一款基于人工智能的虚拟试穿工具，采用CLIP和VAE编码提取服装外观先验，并结合服装聚焦适配器和高频细节增强算法，生成高保真试穿图像。它能够精准对齐服装与人体姿态，保留复杂图案与纹理，适用于电子商务、时尚设计、个性化推荐、社交媒体、虚拟时尚秀及游戏等多个领域，提供真实且沉浸式的在线试穿体验。

AI项目与工具 2025年06月12日 55 点赞 0 评论 740 浏览

九章大模型(MathGPT)

学而思九章大模型是好未来自主研发的，面向全球数学爱好者和科研机构，以解题和讲题算法为核心的大模型。

创作工具 1970年01月01日 0 点赞 0 评论 741 浏览

元经纪

集合全球元宇宙行业的优质供应链，一站式采购您所需要的元宇宙行业解决方案和产品。全网比价，为您筛选出最优性价比的供应商。

创作工具 1970年01月01日 0 点赞 0 评论 741 浏览

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型，结合Whisper编码器与Qwen2 LLM，支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略，提升模型泛化能力和稳定性。基于约5万小时语音数据训练，性能优异，适用于智能客服、教育、心理健康监测等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 741 浏览

Chatbox AI

Chatbox AI是一款开源跨平台AI助手，支持多语言模型集成与本地部署，提供图像生成、代码辅助、文档交互等功能。用户可自由定制并参与社区开发，确保数据安全与隐私保护，适用于办公、学习、开发等多种场景，提升工作效率与创意表达。

AI项目与工具 2025年06月12日 66 点赞 0 评论 741 浏览

MAI

MAI-DS-R1 是微软基于 DeepSeek R1 优化的 AI 模型，具备高敏感话题响应能力（99.3%），有害内容风险降低 50%，并保持与原版相同的推理水平。支持多语言输出，适用于国际组织、企业及教育机构。已开源，可用于研究与开发，适用于内容审核、多语言客服、学术研究等多种场景。

AI项目与工具 2025年06月11日 56 点赞 0 评论 741 浏览

Pixtral 12B是一款由法国初创企业Mistral开发的多模态AI模型，能够同时处理图像和文本数据。该模型包含120亿参数，大小约为24GB，基于Nemo 12B文本模型构建。它具备强大的图像和文本处理能力，能够执行图像描述生成、统计照片中的物体数量等任务，并在多个基准测试中表现出色。Pixtral 12B将根据Apache 2.0许可证开源，用户可以自由下载和微调该模型。应用场景广泛，包括

AI项目与工具 2025年06月12日 69 点赞 0 评论 742 浏览

MaskGCT

MaskGCT是一款基于掩码生成模型与语音表征解耦编码技术的语音合成大模型，由趣丸科技与香港中文大学（深圳）联合开发。其主要功能包括声音克隆、跨语种语音合成、语音控制及高质量语音数据集支持。该模型在多个TTS基准数据集上表现优异，可快速精准地克隆音色并灵活调整语音属性，适用于多种语言，已开源并面向全球用户开放。

AI项目与工具 2025年06月12日 35 点赞 0 评论 744 浏览

K2

地球科学的开源大预言模型，首先在收集和清理过的地球科学文献（包括地球科学开放存取论文和维基百科页面）上对 LLaMA 进行进一步预训练，然后使用知识密集型指令调整数据（GeoSig...

Ai平台模型 1970年01月01日 0 点赞 0 评论 744 浏览

Moffee

Moffee是一款开源的Markdown转PPT工具，允许用户通过Markdown语法高效地创建专业的幻灯片。该工具具备自动化布局功能，能够智能处理幻灯片的布局、分页和样式，同时支持实时预览和导出为PDF或HTML格式。Moffee支持多种内置主题，使得用户可以根据需要选择合适的样式，适合普通用户和开发者使用。

AI项目与工具 2025年06月12日 55 点赞 0 评论 745 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期