AI

ToonMe

ToonMe,免费的卡通头像生成神器,效果超赞!无需下载,在线生成。

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型,支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项,适用于不同场景。其基于开源框架开发,易于扩展,可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

Stable Diffusion整合包

Stable Diffusion整合包是一款专为新手用户设计的本地部署解决方案,由B站UP主秋葉aaaki开发。它包含Stable Diffusion WebUI、必要的运行环境、预装模型及常用插件,使得用户无需复杂的技术背景就能便捷地安装和使用AI绘画工具。最新版本支持自动更新和多版本切换,并提供了丰富的预装资源和汉化界面,极大地简化了环境配置过程。

GOT-OCR2.0

创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。

佐治亚理工学院

佐治亚理工学院(Georgia Institute of Technology,又称乔治亚理工学院,简称Georgia Tech,Gatech,GT),1885年建校,是一所坐落于佐治亚州首府亚特兰大的公立研究型大学 ,美...

话炉

一个由字节跳动旗下的AI角色创建智能体平台,英文名为BagelBell。它为用户提供了一个充满活力和创造力的虚拟世界,用户可以在这个世界中探索故事、创作角色,并与AI角色进行互动。

IMGUpscaler

一款免费的AI 图像无损放大工具,可以毫不费力地提高图像分辨率和质量,不用注册登录就能免费用。

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列,具备从5.9M到632.1M参数的多种模型,适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略,训练效率比同类模型高2至3倍,在多模态任务中表现优异。支持可变大小patch输入,兼具灵活性与高效性,广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

PaperCcb查查呗

免费论文重复率检测,论文降重,论文格式规范,学术不端检测知网查重等一站式服务