文本提示 - 智狐AI导航

SUPIR

SUPIR是一种创新的图像修复和画质增强方法，基于大规模生成模型StableDiffusion-XL（SDXL）和模型扩展技术。它通过深度学习和多模态方法实现低质量图像的高质量恢复，支持通过文本提示进行图像恢复的精细控制。SUPIR适用于多种应用场景，如老照片修复、模糊图像增强、噪点去除和色彩校正与增强。

AI项目与工具 2024年01月01日 88 点赞 0 评论 712 浏览

IDM

IDM-VTON是一种基于改进扩散模型的先进AI虚拟试穿技术，由韩国科学技术院和OMNIOUS.AI的研究人员共同开发。该技术利用视觉编码器提取服装的高级语义信息，并通过GarmentNet捕捉服装的低级细节特征，从而生成逼真的人物穿戴图像。IDM-VTON支持文本提示理解，实现了个性化定制和逼真的试穿效果，广泛应用于电子商务、时尚零售、个性化推荐、社交媒体以及时尚设计等领域。

AI项目与工具 2024年01月01日 49 点赞 0 评论 689 浏览

Krea Video

Krea Video为视频创作者提供简单高效的创作工具。

Ai视频生成 2026年06月27日 0 点赞 0 评论 646 浏览

LiveSketch

LiveSketch是一款AI生成视频工具，用户通过文本提示将静态素描转化为动画，它提供了一种简单直观的方法，使他们的素描变得生动活泼。

Ai开源项目 2025年06月05日 92 点赞 0 评论 637 浏览

Patchwork

Patchwork是一款基于AI技术的多人协作工具，专为虚拟世界构建设计。支持无限画布上的实时协作，用户可通过文本提示生成角色、地点及事件等元素，并可保存和分享成果。其功能包括生成图像、碎片操作、工具箱使用以及权限管理等，广泛应用于小说创作、游戏开发、电影制作和教育等领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 587 浏览

Hallo2

Hallo2是一款由复旦大学、百度公司和南京大学合作开发的音频驱动视频生成模型。它能够将单张图片与音频结合，并通过文本提示调节表情，生成高分辨率4K视频。Hallo2采用了补丁下降、高斯噪声等数据增强技术，提升了视频的视觉一致性和时间连贯性，同时通过语义文本标签提高了生成内容的可控性与多样性。该模型适用于电影、游戏、虚拟助手等多个领域，展现出强大的内容生成能力。

AI项目与工具 2025年06月12日 80 点赞 0 评论 569 浏览

Remaker AI

一款AI图像生成器、AI换脸器和AI图像编辑器。能让用户能够无缝替换图像和视频中的脸部，除此之外，Remaker AI 还拥有对象移除器、图像放大器和各种其他AI工具。

Ai图片处理 2025年06月05日 19 点赞 0 评论 557 浏览

谷歌DeepMind推出V2A技术，可为无声视频添加逼真音效

DeepMind推出的V2A（Video-to-Audio）模型能够将视频内容与文本提示相结合，生成包含对话、音效和音乐的详细音频轨道。它不仅能够与DeepMind自身的视频生成模型Veo协同工作，还能与其他视频生成模型，如Sora、可灵或Gen 3等，进行集成，从而为视频添加戏剧性的音乐、逼真的音效或与视频中角色和情绪相匹配的对话。V2A的强大之处在于其能够为每个视频输入生成无限数量的音轨。该模

AI项目与工具 2025年06月12日 21 点赞 0 评论 556 浏览

Illustroke

Illustroke 是一个为个人和商业用途提供免费插图的网站。这些插图是由在平台上分享他们作品的各种艺术家创作的。

免商图片 2025年06月05日 89 点赞 0 评论 531 浏览

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架，允许用户通过文本提示生成包含多个事件的连贯视频，并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧，同时结合预训练的视频扩散变换器（DiT）和大型语言模型（LLM）的提示增强功能，进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域，为视频创作带来了创新性的解决方案。

AI项目与工具 2025年06月12日 42 点赞 0 评论 525 浏览

文本提示

首页

文本提示

列表

默认

浏览次数

发布日期