CLIP - 智狐AI导航

BLIP3

BLIP3-o是Salesforce Research等机构推出的多模态AI模型，结合自回归与扩散模型优势，实现高效图像理解和生成。基于CLIP语义特征，支持文本与图像间的双向转换及图像编辑。采用顺序预训练策略，提升模型性能。完全开源，适用于创意设计、视觉问答、艺术生成等多种场景。

AI项目与工具 2025年06月11日 12 点赞 0 评论 596 浏览

混元DiT（Hunyuan-DiT）是腾讯混元团队开源的高性能文本到图像的扩散Transformer模型，具备细粒度的中英文理解能力，能够生成多分辨率的高质量图像。该模型结合了双语CLIP和多语言T5编码器，通过精心设计的数据管道进行训练和优化。混元DiT的主要功能包括双语文本到图像生成、细粒度中文元素理解、长文本处理能力、多尺寸图像生成、多轮对话和上下文理解、高一致性和艺术性。此外，混元DiT在

AI项目与工具 2024年01月01日 64 点赞 0 评论 595 浏览

Boximator

Boximator是一种视频合成技术，通过引入硬框和软框实现对视频中对象的位置、形状或运动路径的精细控制。它基于视频扩散模型，通过多阶段训练和自跟踪技术，确保视频合成过程中的高质量和逼真度。应用场景包括电影和电视制作、游戏开发以及VR和AR内容创作。

AI项目与工具 2024年02月20日 89 点赞 0 评论 577 浏览

Stable Diffusion Reimagine

Stable Diffusion Reimagine，简称SD-R是一款新的Clipdrop工具，允许用户无限制地生成单张图片的多种变化。

Ai绘画生成 2025年06月05日 87 点赞 0 评论 576 浏览

Xmind

Xmind是一款非常实用的商业思维导图软件，应用全球最先进的Eclipse RCP 软件架构，全力打造易用、高效的可视化思维软件。致力于使用先进的软件技术帮助用户真正意义上提高生产率。

思维导图 2025年06月05日 64 点赞 0 评论 575 浏览

ScriptViz

ScriptViz是一款基于MovieNet数据库的剧本可视化工具，利用CLIP模型实现剧本文本与电影画面的匹配，支持用户通过SQL语句设定剧本属性并生成视觉化参考。其功能涵盖视觉素材检索、剧本与视觉匹配、故事分析及对话对齐可视化，旨在提升剧本创作过程中的视觉表现力和叙事连贯性。此外，ScriptViz还提供情绪捕捉、场景细化及角色开发等应用，适用于剧本开发、故事板制作等多个场景。

AI项目与工具 2025年06月12日 18 点赞 0 评论 544 浏览

AddressCLIP

AddressCLIP 是一种基于 CLIP 技术的端到端图像地理定位模型，由中科院自动化所与阿里云联合开发。它通过图像与地址文本对齐和地理匹配技术，实现街道级别的精确定位，无需依赖 GPS。模型在多个数据集上表现优异，适用于城市管理、社交媒体、旅游导航等多个场景，具备良好的灵活性和多模态结合潜力。

AI项目与工具 2025年06月12日 30 点赞 0 评论 543 浏览

SwiftBrush V2

SwiftBrush V2 是一款基于文本到图像的单步扩散模型，通过改进权重初始化、LoRA训练及夹紧CLIP损失等技术，实现了与多步Stable Diffusion模型相媲美的性能。它无需真实图像数据即可训练，显著提升了生成速度和图像质量，广泛应用于艺术创作、游戏开发、虚拟现实等领域。

AI项目与工具 2025年06月12日 21 点赞 0 评论 537 浏览

NextClip

利用先进的人工智能技术，我们为您打造了一个无需专业背景即可轻松创作沉浸式视频小说的平台

Ai视频生成 1970年01月01日 0 点赞 0 评论 529 浏览

Pony Diffusion

一个擅长生成高质量、风格化、可爱动物主题的AI动漫艺术图片生成器，可以生成高质量的非真实感图像，涵盖各种风格，增强创造力和艺术表现力。

Ai绘画生成 2025年06月05日 70 点赞 0 评论 395 浏览

CLIP

首页

CLIP

列表

默认

浏览次数

发布日期