图像

BlueWillow

BlueWillow 是一种基于 Web并使用人工智能根据您的文本输入生成逼真而美丽的图像。

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型,通过“扩展-压缩”策略优化处理高分辨率图像和长视频,兼具效率与准确性。它在图像和视频基准测试中表现优异,支持时间定位、机器人导航和医疗成像等应用场景,并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

Creati

Creati是一款基于AI技术的图像处理工具,可一键美化照片、去除并更换背景、调整服装和发型,支持虚拟场景应用。它能生成高质量图像,适用于社交媒体、电商、个人简历等多个场景,同时提供个性化AI档案功能,帮助用户优化照片效果,提升视觉呈现质量。

Neural.Love

neural.love是一个提供免费AI图像生成和AI增强工具的网站。用户可以访问数百万的公共领域图像,用于他们的创意项目,并可以使用AI技术轻松增强图像。

SelfyzAI

SelfyzAI是一款由万兴科技推出的AI驱动型照片和视频编辑工具,具备照片舞蹈动画、AI艺术滤镜、面部修图、背景替换及身体编辑等功能。它能够将静态图像转换为动态视频,适用于社交媒体内容创作、个人照片优化及创意摄影等多种场景,提升用户的视觉表达能力与趣味性体验。

StreamMultiDiffusion

StreamMultiDiffusion是一款开源的实时交互式图像生成框架,结合了扩散模型的高质量图像合成能力和区域控制的灵活性。用户可以实时生成和编辑图像,通过文本提示和手绘区域生成特定部分的图像,提供高质量的图像输出。其主要功能包括实时图像生成、指定区域文本到图像生成、直观的用户界面、多提示流批处理架构、快速推理技术、区域控制、稳定化技术和Semantic Palette交互式图像生成。

ComfyGen

ComfyGen是一款基于大型语言模型(LLM)的文本到图像生成系统,能够根据用户提供的文本提示自动生成高质量图像。它通过结合多种专业组件如微调基础模型、LoRAs、嵌入技术和超分辨率处理等构建复杂工作流,并采用两种基于LLM的方法优化图像生成质量,适用于艺术创作、游戏开发、广告设计、电影制作等多个领域。

Publer AI Assist

Publer AI Assist 使用最新的人工智能技术帮助您在几秒钟内生成内容、创建令人惊叹的图像并像专业人士一样回复评论。

MM1.5

MM1.5是苹果公司研发的多模态大型语言模型,具备强大的文本与图像理解能力,包括视觉指代、定位及多图像推理功能。它通过数据驱动的训练方法,实现了从1B到30B参数规模的性能提升,并推出了视频和移动UI专用版本,为多模态AI技术发展提供重要参考。主要应用场景涵盖图像与视频理解、视觉搜索、辅助驾驶、智能助手及教育领域。

photoeditor

PhotoEditor是一款基于人工智能技术的在线图片编辑工具,支持多种格式的照片编辑,具备智能对象移除、自动图像增强、人像修饰、图像放大和多样化编辑工具等功能。凭借其对像素和上下文的精准分析,能够生成自然且高质量的结果,适用于社交媒体内容创作、电子商务产品图片处理、旅游照片优化和个人相册整理等多种应用场景。 ---