图像

Smart PDFs

Smart PDFs 是一款免费开源的 AI 工具,用于快速提取和总结 PDF 文档的关键信息。它支持学术论文、行业报告和技术文档等多种格式,可在数秒内生成结构清晰的章节式摘要。工具采用 Llama 3.3 模型进行智能处理,并支持图像生成和内容分享功能,适用于学术、职场和个人使用场景。

Modeli.ai

一个旨在使用AI模型为时尚产品优化和替代传统的拍照流程的AI模特生成工具。

Video Diffusion Models

Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力,通过创新的梯度条件方法和自回归扩展技术,生成了具有高度时间连贯性和质量的视频样本。

绘世启动器

绘世启动器是由B站UP主@秋葉aaaki开发的电脑桌面应用,旨在简化Stable Diffusion-WebUI项目的启动和管理。它支持一键启动、修复、更新、模型下载、模型管理和模型训练等功能,特别适合低配电脑和无编程基础的用户。启动器内置疑难解答系统,能够诊断并解决常见错误,同时支持部署SD-WebUI、ComfyUI等多种WebUI界面,便于用户构建完整的环境。

FlexIP

FlexIP 是腾讯推出的图像合成框架,支持在保持主体身份的同时进行个性化编辑。其双适配器架构分离身份保持与编辑功能,结合动态权重门控机制实现灵活控制,并通过多模态数据训练提升生成质量与稳定性,适用于艺术创作、广告设计、影视制作等多个领域。

No more copyright

No More Copyright 是一款利用人工智能技术的在线工具,能够将用户上传的图片转化为无版权争议的原创版本,广泛适用于内容创作、广告设计、艺术创作及教育等领域。其核心功能包括即时生成、版权自由以及高效图像处理,助力用户在避免侵权风险的同时实现创意目标。

ToonCrafter

ToonCrafter是一个展示平台,它利用先进的生成对抗网络(GAN)技术,将用户的原始动漫帧转化为一系列风格一致、过渡自然的画面。

YOLO

腾讯AI实验室开发的一个实时目标检测工具,它能够自动识别和定位图像中的各种对象

AtomoVideo

AtomoVideo是一款高保真图像到视频生成框架,能够从静态图像生成高质量视频内容。它通过多粒度图像注入和高质量数据集及训练策略,保证生成视频与原始图像的高度一致性和良好的时间连贯性。此外,AtomoVideo还支持长视频生成、文本到视频生成以及个性化和可控生成等功能。

ViGen.AI

一个人工智能驱动使用尖端的生成算法来生成高质量的电子商务商品图像的网站,ViGen.AI还提供背景去除、图像定制和AI图像编辑等功能。