图像

LTXV

LTXV-13B 是 Lightricks 推出的开源 AI 视频生成模型,拥有 130 亿参数,可在消费级显卡上高效运行,生成速度比同类产品快 30 倍。支持文本、图像转视频及多关键帧调节,具备多尺度渲染和高压缩率技术,适用于影视、广告、游戏、教育等多个领域,提升内容创作效率与质量。

MagicVideo

MagicVideo-V2是一款由字节跳动公司团队开发的AI视频生成模型和框架。该模型通过集成文本到图像模型、视频运动生成器、参考图像嵌入模块和帧插值模块,实现了从文本到高保真视频的转换。生成的视频不仅具有高分辨率,而且在视觉质量和运动流畅度方面表现出色,为用户提供卓越的观看体验。

Agentic Object Detection

Agentic Object Detection是由吴恩达团队研发的新型目标检测技术,通过智能代理系统实现无需标注数据的目标识别。用户输入文字提示后,AI可精准定位图像中的目标及其属性,支持内在属性、上下文关系及动态状态的识别。该技术无需复杂训练流程,适用于装配验证、作物检测、医疗影像分析、危险物品识别和商品管理等多种场景,显著提升了检测效率和准确性。

OmniEdit

OmniEdit是一款基于多专家模型监督训练的先进图像编辑工具,支持七种核心图像编辑任务,包括对象替换、移除、添加、属性修改、背景替换、环境变化和风格转换。它能够处理不同宽高比和分辨率的图像,采用EditNet架构,提升了编辑的成功率和图像保真度。OmniEdit在自动与人工评估中表现优异,适用于专业设计、社交媒体内容创作、电子商务、新闻媒体等多个领域。

海螺AI

海螺AI是一款由MiniMax打造的AI视频生成工具,凭借其强大的文本转视频能力和图像扩展功能,可快速生成高质量、情感丰富的视频内容。支持多种语言、风格和场景定制,具备高清画质输出、智能审核及模板选择等功能,广泛应用于社交媒体、营销、影视制作、教育等领域。

OThink

OThink-MR1是由OPPO研究院与香港科技大学(广州)联合研发的多模态语言模型优化框架,基于动态KL散度策略(GRPO-D)和奖励模型,提升模型在视觉计数、几何推理等任务中的泛化与推理能力。其具备跨任务迁移能力和动态平衡探索与利用机制,适用于智能视觉问答、图像描述生成、内容审核等多个领域,具有广阔的应用前景。

Trickle

Trickle 是一款零代码网页应用开发工具,通过自然语言输入即可快速构建功能完善的网页应用。它支持自动生成前端、后端及数据库,具备一键发布和托管功能。内置图像优化、数据分析和文案生成等 AI 能力,并提供丰富模板库。适用于小商家、创业者、设计师及企业等多种场景,提升开发效率与用户体验。

TryOffAnyone

TryOffAnyone是一款基于Latent Diffusion Models技术的AI工具,专注于从人物照片中提取服装区域并生成平铺展示图。它具备在线图片处理、智能服装识别、背景去除和图像优化等功能,广泛应用于电商平台的商品展示、个性化推荐、库存管理和图像检索等领域,帮助提升用户体验和运营效率。

吐司AI换脸

吐司AI换脸是一款基于ComfyUI Workflow的图像处理工具,支持高质量人像换脸。用户只需上传目标图像和参考人脸图像,即可快速生成自然逼真的换脸效果。该工具提供精细化遮罩处理、面部修复、风格统一等功能,并兼容多种模型和版本。适用于影视、广告、艺术创作、社交媒体及游戏开发等多个领域,操作简便,效果出色。

Markdown

Markdown-to-Image 是一个基于 React 的开源工具,可将 Markdown 文本转换为图像,支持多种输出格式和自定义样式。其应用场景包括社交媒体内容创作、技术文档可视化、博客标题设计以及教育和营销材料制作,具备强大的灵活性和易用性。