R

Zero123

一种从单个图像到一致的多视图扩散基础模型,旨在使用单视图输入生成 3D 一致的多视图图像。

Droidrun

Droidrun是一款基于AI的Android设备自动化工具,结合视觉识别、UI解析与LLM推理技术,支持自然语言控制和多平台部署。它能执行复杂任务自动化,具备自愈机制、多LLM兼容性及丰富的扩展接口,适用于AI助手、数据交互、测试验证等多种场景。

Rask Ai

Rask AI是新一代的视频翻译和配音工具,是一个利用先进的人工智能技术来自动化视频内容本地化和翻译过程的平台。

HRAvatar

HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术,能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术,结合精确的表情编码器和物理渲染模型,实现高精度重建和实时渲染(约155 FPS)。支持材质编辑、跨视角渲染和动画化,适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。

靠岸学术

Scholaread是一款专注于学术研究的多功能工具,集成了PDF阅读、学术翻译、文献管理和笔记功能。其主要特点包括支持多平台同步、一键同步Zotero论文库、重排模式优化阅读体验、逐段对照翻译支持多语言、图片及表格放大查看、引文添加至阅读列表、目录跳转以及高亮笔记标注。适用于学术研究、文献综述、跨语言研究、移动学习及团队协作等多种场景。

书生·浦像

书生·浦像是由多家科研机构联合开发的超高动态成像算法,核心为浦像HDR(UltraFusion HDR)。它结合AIGC与HDR技术,在极端光照条件下实现图像细节修复和高质量输出,有效解决动态场景中的运动伪影问题。适用于摄影、手机成像和自动驾驶等领域,具有多曝光融合、动态处理、色调映射等功能,提升了图像的鲁棒性与真实感。

Phraser

Phraser 是一款人工智能驱动的工具,专为 Midjourney、Dall-E、Stable Diffusion、Disco Diffusion 和 Craiyon 等领先艺术生成器的快速创作而设计。

SongR AI

一款可以让用户只需几个关键词创建定制歌曲的平台。无论用户的音乐经验如何,SongR AI都可以让你生成个性化的歌曲。

RepText

RepText是一款由Shakker Labs与Liblib AI联合开发的多语言视觉文本渲染框架,采用字形模仿技术实现高质量文本生成。支持多种语言及复杂排版,具备精准控制、高效兼容和自然融合等特点,广泛应用于平面设计、艺术创作和数字内容生产等领域。

ColorFlow

ColorFlow是一款由清华大学与腾讯ARC实验室联合研发的图像序列着色模型,具备检索增强、上下文学习及超分辨率技术,能够精准保持个体身份并实现高质量着色。该工具在漫画、动画制作、老照片修复及艺术创作等领域具有广泛应用价值,同时支持学术研究和技术探索。