图像 - 智狐AI导航

AI拥抱生成器

一款可以将您的静态图像轻松生成两人拥抱的的动态视频AI工具。只需点击几次，您就可以自定义拥抱视频的风格、动作和氛围。

Ai视频生成 2025年06月05日 86 点赞 0 评论 658 浏览

IterComp

IterComp是一种基于迭代反馈学习机制的文本到图像生成框架，由多所顶尖高校的研究团队联合开发。它通过整合多个开源扩散模型的优势，利用奖励模型和迭代优化策略，显著提升了生成图像的质量和准确性，尤其在多类别对象组合与复杂语义对齐方面表现突出，同时保持较低的计算开销。IterComp适用于艺术创作、游戏开发、广告设计、教育和媒体等多个领域。

AI项目与工具 2025年06月12日 31 点赞 0 评论 658 浏览

I2V3D

I2V3D是一款由香港城市大学与微软GenAI合作开发的图像到视频生成工具，支持将静态图像转换为高质量动态视频。其核心在于结合传统CG管线与生成式AI技术，采用两阶段生成流程实现精准的3D动画控制，支持复杂场景编辑和灵活的视频生成，适用于动画制作、视频创作及教育等多个领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 658 浏览

FakeShield

FakeShield是一款由北京大学研发的多模态大型语言模型框架，主要用于检测和定位图像篡改。它通过结合视觉与文本信息，生成篡改区域掩码并提供详细的判断依据。其核心模块包括领域标签引导的检测模块和多模态定位模块，支持多种篡改技术的分析，具有较高的准确性与可解释性。FakeShield广泛应用于社交媒体内容审核、法律取证、新闻媒体真实性验证以及版权保护等领域。

AI项目与工具 2025年06月12日 41 点赞 0 评论 657 浏览

Momo

Momo 是一款基于人工智能的照片生成工具，支持在移动端使用。用户上传 8-12 张照片后，可生成高真实度的 AI 头像和图像，并支持多种风格选择，如商务、约会、旅行等。应用提供高分辨率输出，适用于社交媒体、求职和约会等场景，帮助用户打造个性化的数字形象。

AI项目与工具 2025年06月12日 31 点赞 0 评论 657 浏览

Styldod

良好的房源图片是房屋销售过程的基石。Styldod 帮助您快速、轻松、低成本地编辑和增强照片、消除杂乱背景。

Ai图片处理 2025年06月05日 84 点赞 0 评论 657 浏览

ezpic

ezpic是一款基于AI技术的在线图片背景移除工具，支持PNG和JPG格式，能快速准确地去除背景并提供背景颜色选择功能。用户可通过简单操作实现图片美化，提升设计效率。适用于电商、设计、社交媒体、办公及教育等多个场景，完全免费，适合各类用户使用。

AI项目与工具 2025年06月12日 19 点赞 0 评论 657 浏览

DiffusionGPT

DiffusionGPT是一款基于大型语言模型的开源文本到图像生成系统，由字节跳动与中山大学联合开发。它采用思维树和优势数据库技术，能够解析和处理多样化的文本提示，生成高质量图像。系统通过多模型的选择与集成、基于人类反馈的优化以及高效的图像生成执行，实现了从文本到图像的无缝转换。DiffusionGPT适用于多种应用场景，具有广泛适用性和灵活性。

AI项目与工具 2024年01月01日 93 点赞 0 评论 657 浏览

Pixel3DMM

Pixel3DMM是由慕尼黑工业大学、伦敦大学学院和Synthesia联合开发的单图像3D人脸重建框架，基于DINOv2模型，能从单张RGB图像中准确重建出3D人脸的几何结构。该工具擅长处理复杂表情和姿态，支持身份和表情的解耦，并通过FLAME模型优化实现高精度重建。其应用场景涵盖影视游戏、VR/AR、社交视频、医疗美容和学术研究。

AI项目与工具 2025年06月11日 88 点赞 0 评论 656 浏览

Voyage Multimodal

Voyage Multimodal-3 是一款多模态嵌入模型，能够处理文本、图像以及它们的混合数据，无需复杂文档解析即可提取关键视觉特征。它在多模态检索任务中的准确率显著高于现有最佳模型，支持语义搜索和文档理解，适用于法律、金融、医疗等多个领域的复杂文档检索任务。

AI项目与工具 2025年06月12日 27 点赞 0 评论 656 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期