图像

混元图像2.0

混元图像2.0是腾讯开发的AI图像生成工具,支持文本、语音、草图等多种输入方式,具备实时生成能力。其采用单双流DiT架构和多模态大语言模型,生成图像写实性强、细节丰富,且响应速度快,适用于创意设计、广告营销、教育、游戏等多个领域。用户可通过网页端直接操作,实现高效的图像创作体验。

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具,用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎,支持 100 多种语言,具备图像优化、纠偏、清洁等功能,提升识别准确率。支持多核处理与批量操作,适合高效处理大量文件,且完全离线运行,保障数据安全。

InvokeAI

InvokeAI 是一个开源项目,是 Stable Diffusion 模型的领先创意引擎,它为使用 Stable Diffusion 模型生成高质量图像提供了简化的过程。

AI2image

AI2image 是一个基于AI技术,通过将您的文字转换为符合您的风格和偏好的图像。您可以使用它为您的网站、博客、社交媒体或其他目的。

SellerPic.AI

一款专为电商卖家设计的先进AI图片工具。SellerPic.AI使用户能够为其产品生成专业品质的商品像,包括AI生成的时装AI模特和商品图像。

替我做图

替我做图是一款基于AI技术的图像生成平台,提供人台图、真人图、假发图、物品图等多样化服务,支持真人换脸及产品展示图优化,广泛应用于电商、社交媒体营销、广告制作等领域,助力提升品牌形象和营销效果。

HeadshotBooth.ai

HeadshotBooth.ai 是一款基于人工智能技术的在线服务,能够快速生成专业级头像。用户通过上传自拍照并选择背景与服装风格,即可获得高分辨率、多样化的头像作品。其核心优势在于高效生成、丰富定制化选项以及友好的用户体验,广泛适用于社交媒体、职业发展及个人品牌建设等领域。

AIbus

Albus是一款基于ChatGPT的实时白板应用,旨在帮助用户深入探索感兴趣的主题、学习新技能。它具备自动扩展内容、生成问题、搜索图片、创建思维导图等核心功能,同时支持图像生成、语音叙述及多语言对话,可应用于个人学习、创意生成、教育场景及团队协作,提供便捷高效的AI辅助体验。

MIP

MIP-Adapter是一种基于IP-Adapter模型开发的个性化图像生成技术,能够高效处理多参考图像并生成高质量的定制化图像。通过解耦交叉注意力机制和加权合并方法,解决了多图像输入中的对象混淆问题,提升了生成图像的质量。该技术无需测试时微调,具有高效训练的特点,广泛应用于社交媒体、广告、游戏设计等多个领域。

InfiMM

InfiMM-WebMath-40B是由字节跳动与中国科学院联合推出的大规模多模态数据集,涵盖大量数学和科学内容,包括文本、公式、符号及图像。该数据集通过筛选、清洗和标注优化,可显著提升多模态模型的数学推理能力。它适用于数学题库生成、学习工具开发、论文理解及科学研究等多个应用场景。 ---