图像

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型,支持多语言、多模态处理,具备文本、图像及短视频分析能力。提供多种模型尺寸,适配不同硬件环境,优化了单 GPU/TPU 性能,推理速度提升显著。内置图像安全分类器,增强内容安全性。支持多种开发工具和部署方式,适用于人脸识别、物体检测、智能助手、文本分析等场景。

Leffa

Leffa是一种基于注意力机制的可控人物图像生成框架,通过流场学习精确控制人物的外观和姿势。其核心技术包括正则化损失函数、空间一致性及模型无关性,能够在保持细节的同时提升图像质量。Leffa广泛应用于虚拟试穿、增强现实、游戏开发及影视后期制作等领域,展现出卓越的性能与灵活性。

Face Swapper Online

一款由人工智能驱动的在线换脸工具,允许用户在不降低图像质量的情况下交换图片中的面部。

麦橘超然

麦橘超然(MajicFlus)是一款基于Flux.1架构的AI图像生成模型,专注于高质量人像创作,尤其擅长表现亚洲女性的细腻特征。它支持快速生成与专业控制,具备优秀的光影处理能力和局部重绘功能,适用于人像、非人生物及场景生成。该工具广泛应用于娱乐、商业、影视、教育及科研等多个领域,为创作者提供高效、灵活的图像生成解决方案。

Firefly Video Model

Adobe的新AI视频生成工具,建立在Firefly生成性AI图像模型基础上。Firefly Video Model提供文本到视频、图像到视频以及视频编辑功能,每次生成片段最长限制为5秒。

Freepik Pikaso

Freepik Pikaso是一款实时AI绘画生成工具,它通过人工智能技术让用户能够通过简单草图和描述性文字实时生成艺术作品。该工具具备实时绘画创作、描述性艺术生成、图标和元素库、摄像头和屏幕共享、播放模式以及图像质量提升等功能。适用于设计师、艺术家、插画家、内容创作者、营销和广告专业人士以及非专业用户。

PersonaMagic

PersonaMagic 是一种基于文本条件策略的人脸生成技术,通过动态嵌入学习和双平衡机制实现高保真个性化图像生成。该工具可依据文本提示调整人脸风格、表情和背景,同时保持身份特征。支持单图像训练,降低数据需求,并可与其他模型结合使用。实验显示其在文本对齐和身份保持方面表现优异,适用于娱乐、游戏、影视及营销等多个领域。

Napkin AI

一款让人眼前一亮的笔记产品,它的强大功能在于能够将文字变成图像。用户只需将文本粘贴到平台上,Napkin便能自动识别文本内容,它能够将你的文字内容,瞬间转化为生动的图表、信息图、流程图等视觉元素。

Video Alchemist

Video Alchemist是一款由Snap公司研发的视频生成模型,支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块,通过文本提示和参考图像生成视频内容,无需测试优化。模型引入自动数据构建和图像增强技术,提升主体识别能力。同时,研究团队提出MSRVTT-Personalization基准,用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧

Kimi Latest

Kimi Latest是月之暗面推出的实时更新AI模型,支持128k上下文长度,可自动选择模型规模并优化成本。具备图像理解、自动上下文缓存和多模态处理能力,适用于聊天应用、内容创作及数据分析等多种场景,为开发者和用户提供稳定高效的AI解决方案。