图像 - 智狐AI导航

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 780 浏览

Co

Co-op Translator是一款基于Azure AI服务的开源多语言翻译工具，支持Markdown文件及图像文本的自动化翻译。它采用先进的大型语言模型（LLM）技术，确保翻译质量的同时保持语义准确性和上下文连贯性。该工具可无缝集成到现有项目中，帮助简化本地化流程，适用于开源项目文档、软件开发、技术博客、教育材料以及企业内部文档等多种应用场景。

AI项目与工具 2025年06月12日 81 点赞 0 评论 781 浏览

智谱AI绘画

智谱AI绘画可根据用户的描述创作出新的艺术作品，还能够模仿不同的艺术风格，提供个性化的图像编辑和创作服务

Ai绘画生成 1970年01月01日 0 点赞 0 评论 782 浏览

DanceGRPO

DanceGRPO 是由字节跳动与香港大学联合开发的视觉生成强化学习框架，支持文本到图像、文本到视频、图像到视频等多种任务，兼容多种生成模型与奖励机制。其通过强化学习优化生成过程，提升视觉内容质量与一致性，降低显存压力，提高训练效率与稳定性，适用于视频生成和多模态内容创作。

AI项目与工具 2025年06月11日 45 点赞 0 评论 782 浏览

Long

Long-VITA是一款由腾讯优图实验室、南京大学和厦门大学联合开发的多模态AI模型，支持处理超长文本（超过100万tokens）及多模态输入（图像、视频、文本）。通过分阶段训练提升上下文理解能力，结合动态分块编码器与并行推理技术，实现高效处理长文本和高分辨率图像。模型基于开源数据训练，适用于视频分析、图像识别、长文本生成等场景，性能在多个基准测试中表现突出。

AI项目与工具 2025年06月12日 65 点赞 0 评论 782 浏览

Chromox

Chromox是一款基于AI技术的视频生成工具，可将文本和图像快速转化为高质量的视频内容。支持文本到视频、图像到视频的转换，并提供多样化的风格选项，适用于广告、教育、社交媒体等多种场景。其用户友好型界面和高清晰度输出使其成为创意表达的理想选择。

AI项目与工具 2025年06月12日 26 点赞 0 评论 782 浏览

Make-A-Character

创新的3D角色生成框架，它通过文本描述快速创建逼真的3D角色，具有高度的定制性和逼真度。它结合了最新的人工智能技术，提供了一个直观、灵活且高效的角色创建解决方案，适用于多...

Ai平台模型 1970年01月01日 0 点赞 0 评论 784 浏览

PIXMAKER

PIXMAKER是一款基于AI技术的图像生成与编辑平台，主要服务于电商行业。其核心功能涵盖AI生成产品背景、虚拟试穿效果、多姿势模特照片生成、动态产品视频制作以及背景移除等。用户无需具备专业设计技能即可快速生成高质量的产品图片和视频，从而提升商品展示效果并促进销售转化。该工具广泛应用于电商、市场营销、时尚服装等多个领域，助力企业高效完成产品视觉内容创作。

AI项目与工具 2025年06月12日 52 点赞 0 评论 784 浏览

Goku

Goku是由香港大学与字节跳动联合开发的AI视频生成模型，支持文本到图像、文本到视频、图像到视频等多种生成方式。其核心优势在于高质量的视频输出、低制作成本及多模态生成能力。Goku+作为扩展版本，专注于广告视频创作，具备稳定的动作表现和丰富的表情交互。模型基于大规模数据集和先进架构，适用于广告、教育、娱乐等多个领域，提升了内容创作效率与质量。

AI项目与工具 2025年02月11日 29 点赞 0 评论 785 浏览

Flux AI

一款由Flex.1驱动的图像生成器，Flux AI可以快速生成高质量、逼真的Flux AI图像，包括完美的Flux AI生成的手部细节。

Ai绘画生成 2025年06月05日 89 点赞 0 评论 785 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期