R

Motion Dreamer

Motion Dreamer是由香港科技大学(广州)研发的视频生成框架,采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制,支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能,已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

Droidrun

Droidrun是一款基于AI的Android设备自动化工具,结合视觉识别、UI解析与LLM推理技术,支持自然语言控制和多平台部署。它能执行复杂任务自动化,具备自愈机制、多LLM兼容性及丰富的扩展接口,适用于AI助手、数据交互、测试验证等多种场景。

ShareX

ShareX是一款免费且开源的高级截图工具和屏幕记录器,不仅可以截图,还可以录屏,自动添加水印和阴影,适用于Windows系统。

Buysmart.AI

Buysmart.AI,基于大模型的智能电商购物ai助手,百度“文心杯”创业大赛一等奖。

FramePack

FramePack 是斯坦福大学推出的开源 AI 视频生成模型,通过帧上下文打包和抗漂移采样技术,实现高效、稳定的视频生成。其仅需 6GB 显存即可运行,支持实时高清视频生成,具备灵活的调度策略,适用于多种应用场景,如短视频制作、游戏开发、教育与广告等,显著降低了视频生成的硬件门槛。

通古大模型

通古大模型是由华南理工大学研发的古籍文言文处理AI工具,基于百川2-7B-Base进行增量预训练,结合24.1亿古籍语料和400万对话数据,采用RAT和RAG技术提升古籍处理效果。支持古文句读、文白翻译、诗词创作、古籍赏析、检索问答及辅助整理等功能,广泛应用于古籍数字化、教育、文化传承与学术研究等领域。

ARTROOM

ARTROOM是一款集成了AI技术的图像生成与编辑平台,支持用户通过图层控制、Loras集成及ControlNets技术生成原创艺术作品或参考图片。平台具备丰富的功能,涵盖个性化定制、灵感获取等,并适用于个人艺术创作、企业营销、教育研究等多个领域,助力用户高效完成高质量视觉内容。

LatentSync

LatentSync是由字节跳动与北京交通大学联合研发的端到端唇形同步框架,基于音频条件的潜在扩散模型,无需中间3D或2D表示,可生成高分辨率、动态逼真的唇同步视频。其核心技术包括Temporal Representation Alignment (TREPA)方法,提升视频时间一致性,并结合SyncNet监督机制确保唇部动作准确。适用于影视制作、教育、广告、远程会议及游戏开发等多个领域。

多多群岛DuoDuoLand

多多群岛DuoDuoLand是面向年轻人最有影响力的的职场平台,打造未来AI驱动、强社交基因的Z世代人才网络和项目孵化韶。

书生·浦像

书生·浦像是由多家科研机构联合开发的超高动态成像算法,核心为浦像HDR(UltraFusion HDR)。它结合AIGC与HDR技术,在极端光照条件下实现图像细节修复和高质量输出,有效解决动态场景中的运动伪影问题。适用于摄影、手机成像和自动驾驶等领域,具有多曝光融合、动态处理、色调映射等功能,提升了图像的鲁棒性与真实感。