图像 - 智狐AI导航

FaceFusion

FaceFusion是一款开源AI工具，支持图像和视频中的人脸交换与增强。其主要功能包括高质量的人脸交换、人脸增强、整体画面优化、唇形同步、多模型人脸检测及遮挡处理。通过深度学习技术，FaceFusion能够实现精准的人脸识别与对齐，广泛应用于电影制作、虚拟主播、广告营销及教育培训等领域。

AI项目与工具 2025年06月12日 80 点赞 0 评论 555 浏览

IDIFY

IDIFY是一款开源在线证件照生成工具，借助人工智能技术实现自动抠图和标准化处理。支持本地图像处理、多平台兼容及多样化编辑功能，适用于个人、教育机构、企业和政府部门等场景，确保用户数据安全且操作便捷。

AI项目与工具 2025年06月12日 44 点赞 0 评论 566 浏览

Emu3

Emu3是一款由北京智源人工智能研究院开发的原生多模态世界模型，结合了多模态自回归技术和单一Transformer架构，能够在图像、视频和文本之间实现无缝转换。它不仅能够根据文本生成高质量图像，还能预测视频发展并理解图文内容，广泛应用于内容创作、广告营销、教育、娱乐等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 639 浏览

MemFree

MemFree是一款开源的混合AI搜索引擎，集成了多种AI技术和搜索引擎功能，支持文本、图像、文件和网页等多种输入形式，可提供文本、思维导图、图片和视频等多格式搜索结果。其核心功能涵盖图像处理、文档总结与提问、学术问题解答、代码解释与生成等，特别适用于学术研究、工作办公和日常生活场景，旨在优化知识管理、提升生产力并降低使用成本。

AI项目与工具 2025年06月12日 42 点赞 0 评论 790 浏览

GarDiff

GarDiff是一款基于人工智能的虚拟试穿工具，采用CLIP和VAE编码提取服装外观先验，并结合服装聚焦适配器和高频细节增强算法，生成高保真试穿图像。它能够精准对齐服装与人体姿态，保留复杂图案与纹理，适用于电子商务、时尚设计、个性化推荐、社交媒体、虚拟时尚秀及游戏等多个领域，提供真实且沉浸式的在线试穿体验。

AI项目与工具 2025年06月12日 55 点赞 0 评论 738 浏览

Oryx

Oryx是一款由清华大学、腾讯和南洋理工大学联合开发的多模态大型语言模型，专为处理视觉数据设计。其核心技术包括预训练的OryxViT模型和动态压缩模块，支持任意分辨率的图像处理及高效的视觉数据压缩。Oryx在空间和时间理解上表现优异，广泛应用于智能监控、自动驾驶、人机交互、内容审核、视频编辑及教育等领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 552 浏览

CogView3

CogView3是一款基于中继扩散技术的开源AI图像生成模型，由清华大学与智谱AI联合研发。它通过分阶段生成图像，从低分辨率逐步提升至高分辨率，提高了生成效率并降低了运行成本。CogView3在生成质量和速度上超越了现有的开源模型SDXL，在保持图像细节的同时大幅减少推理时间。其核心特性包括高性能、多分辨率支持及多种优化技术，适用于艺术创作、数字娱乐、广告营销等多个领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 774 浏览

Mage

Mage是一款利用先进AI技术将文本转换为高质量数字艺术作品的创意平台。它支持多种艺术风格和自定义参数，操作简便高效，适用于插画、设计及内容创作等多个领域。平台具备用户友好的界面设计，提供免费基础服务，鼓励社区互动与灵感交流。

AI项目与工具 2025年06月12日 52 点赞 0 评论 765 浏览

ChatGPT Canvas

Canvas是一款由OpenAI开发的AI协作工具，集成了写作与编程功能。它支持实时运行Python代码，提供代码审查、注释、错误修复及多语言代码转换等辅助功能。其上下文感知功能可实时优化文章结构，同时支持自定义GPT模型。Canvas在写作和编程领域均表现出色，适用于个人和团队协作。

AI项目与工具 2025年06月12日 65 点赞 0 评论 743 浏览

Molmo 72B

Molmo 72B是一款由艾伦人工智能研究所推出的开源多模态AI模型，集成了图像和文本处理能力，适用于图像描述生成、视觉问答、文档解析及多模态交互等多种任务。凭借其强大的视觉编码能力和先进的模型架构，Molmo 72B在学术基准测试中表现优异，为开源AI技术的发展做出了重要贡献。

AI项目与工具 2025年06月12日 69 点赞 0 评论 564 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期