ImagePulse ImagePulse是由魔搭社区推出的开源项目,专注于图像理解和生成模型的数据集支持。它通过将复杂任务拆解为“修改、添加、移除”“风格迁移”“人脸保持”等原子能力,构建专门的数据集,提升模型在特定任务上的性能。项目提供开源脚本,支持数据集的生成与扩展,并结合多种技术资源实现多模型协同,适用于艺术创作、视频制作、产品展示等多个领域。 AI项目与工具 2025年06月11日 71 点赞 0 评论 149 浏览
DeepChat 一款开源的AI聊天客户端,内置强大的 DeepSeek 大模型,支持多轮对话、联网搜索、文件上传、知识库等多种功能。 Ai平台模型 2025年06月05日 55 点赞 0 评论 148 浏览
Deep Live Cam 一款开源的实时人脸交换和AI视频换脸工具。它能够利用单张图像对视频或其他图像进行人脸替换,适用于视频制作、动画创作等多种场景。 Ai视频生成 2025年06月05日 41 点赞 0 评论 148 浏览
Jamba Jamba是由AI21 Labs开发的基于Mamba架构的生产级别大语言模型,结合了结构化状态空间模型(SSM)和传统Transformer架构,具备高吞吐量和低内存占用的特点。Jamba拥有256K的上下文窗口,适用于处理长文本序列,并且以开放权重的形式发布,遵循Apache 2.0开源许可。该模型主要用于研究领域,未来将推出更安全的版本。 AI项目与工具 2024年01月01日 29 点赞 0 评论 147 浏览
ReHiFace ReHiFace-S是一款由硅基智能团队开发的开源AI项目,专注于高保真、实时的人脸替换。该算法具备无需数据训练、高保真度换脸、支持多目标人脸替换、色彩矫正、一键快速部署、Gradio交互界面及支持ONNX格式等特点。ReHiFace-S适用于娱乐、影视制作、VR/AR等多个领域,具有实时处理能力、零样本推理、改进的人脸分割模型等功能。 AI项目与工具 2025年06月12日 97 点赞 0 评论 146 浏览
百聆 百聆是一款开源语音对话系统,融合语音识别、语音活动检测、大语言模型和语音合成技术,实现自然流畅的语音交互。支持低延迟运行,无需GPU,适用于边缘设备。具备记忆、工具调用和任务管理等功能,适用于智能家居、个人助理、车载系统等多种场景,提供高效的语音交互解决方案。 AI项目与工具 2025年06月12日 90 点赞 0 评论 146 浏览
VideoRAG VideoRAG是一种基于检索增强生成(RAG)技术的工具,旨在提升长视频的理解能力。它通过提取视频中的多模态信息(如OCR、ASR和对象检测),并将其与视频帧和用户查询结合,增强大型视频语言模型的处理效果。该技术轻量高效,易于集成,适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。 AI项目与工具 2025年06月12日 75 点赞 0 评论 145 浏览
Stability AI开源Stable Diffusion 3 Medium文生图模型 Stable Diffusion 3 Medium是一款由Stability AI开源的文本到图像生成模型,拥有20亿个参数,适用于消费级和企业级GPU。该模型具备照片级真实感、强大的提示理解和排版能力,以及高资源效率。此外,它还支持API试用,并得到了NVIDIA和AMD的支持,以优化其性能。Stability AI致力于开放和安全的AI应用,并计划持续改进SD3 Medium。 AI项目与工具 2024年01月01日 67 点赞 0 评论 145 浏览
Magic Animate Magic Animate是一项开创性的开源项目,简化了动画创作,允许您从单个图像和动态视频制作动画视频。 Ai视频生成 2025年06月05日 48 点赞 0 评论 144 浏览