开源 - 智狐AI导航

Rope

Rope是一款基于深度学习的开源AI换脸工具，利用insightface的inswapper_128模型提供直观的图形界面，支持图片和视频换脸。它具备强大的遮罩功能和参数调节选项，支持超分辨率算法，广泛应用于影视制作、游戏开发、虚拟现实等领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 620 浏览

FaceFusion

FaceFusion是一款开源AI工具，支持图像和视频中的人脸交换与增强。其主要功能包括高质量的人脸交换、人脸增强、整体画面优化、唇形同步、多模型人脸检测及遮挡处理。通过深度学习技术，FaceFusion能够实现精准的人脸识别与对齐，广泛应用于电影制作、虚拟主播、广告营销及教育培训等领域。

AI项目与工具 2025年06月12日 80 点赞 0 评论 628 浏览

Westlake

Westlake-Omni是西湖心辰推出的一款开源中文情感端到端语音交互大模型，融合了语音识别、自然语言处理、情感理解和对话管理等功能，具备实时性和端到端交互特性。它通过深度学习技术和离散表示法，实现从语音输入到语音输出的全流程自动化，生成自然流畅的语音回应，并广泛应用于智能助手、客户服务、教育辅助、健康医疗等领域。

AI项目与工具 2025年06月12日 91 点赞 0 评论 712 浏览

AutoGen Studio

AutoGen Studio是一款由微软研究院推出的开源工具，旨在简化多智能体系统的构建、调试和评估。它提供拖放式界面和Python API，支持声明式规范定义智能体及工作流，具备交互式评估、可重用组件库等功能，适用于客户服务、团队协作、教育、内容创作等多个领域。

AI项目与工具 2025年06月12日 78 点赞 0 评论 954 浏览

IDIFY

IDIFY是一款开源在线证件照生成工具，借助人工智能技术实现自动抠图和标准化处理。支持本地图像处理、多平台兼容及多样化编辑功能，适用于个人、教育机构、企业和政府部门等场景，确保用户数据安全且操作便捷。

AI项目与工具 2025年06月12日 44 点赞 0 评论 648 浏览

GarDiff

GarDiff是一款基于人工智能的虚拟试穿工具，采用CLIP和VAE编码提取服装外观先验，并结合服装聚焦适配器和高频细节增强算法，生成高保真试穿图像。它能够精准对齐服装与人体姿态，保留复杂图案与纹理，适用于电子商务、时尚设计、个性化推荐、社交媒体、虚拟时尚秀及游戏等多个领域，提供真实且沉浸式的在线试穿体验。

AI项目与工具 2025年06月12日 55 点赞 0 评论 800 浏览

CogView3

CogView3是一款基于中继扩散技术的开源AI图像生成模型，由清华大学与智谱AI联合研发。它通过分阶段生成图像，从低分辨率逐步提升至高分辨率，提高了生成效率并降低了运行成本。CogView3在生成质量和速度上超越了现有的开源模型SDXL，在保持图像细节的同时大幅减少推理时间。其核心特性包括高性能、多分辨率支持及多种优化技术，适用于艺术创作、数字娱乐、广告营销等多个领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 852 浏览

RTranslator

RTranslator是一款基于AI技术的开源、免费离线翻译应用，专为Android设备设计。它支持对话模式、对讲机模式及文本翻译功能，能够实现高质量的多语言实时翻译。RTranslator采用Meta的NLLB翻译模型和OpenAI的Whisper语音识别技术，支持多种语言，完全离线运行，保障用户隐私安全。

AI项目与工具 2025年06月12日 44 点赞 0 评论 852 浏览

Molmo 72B

Molmo 72B是一款由艾伦人工智能研究所推出的开源多模态AI模型，集成了图像和文本处理能力，适用于图像描述生成、视觉问答、文档解析及多模态交互等多种任务。凭借其强大的视觉编码能力和先进的模型架构，Molmo 72B在学术基准测试中表现优异，为开源AI技术的发展做出了重要贡献。

AI项目与工具 2025年06月12日 69 点赞 0 评论 635 浏览

OutofFocus

OutofFocus是一款基于AI的图像编辑工具，支持文本提示驱动的图像生成与编辑。其核心功能包括风格转换、内容填充、图像修复和增强等，通过自然语言处理与扩散逆过程重建技术实现高效编辑。该工具具有易用性和灵活性，广泛适用于艺术创作、内容营销、教育研究等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 927 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期