增强

Project Turntable

Project Turntable是一款由Adobe发布的AI工具,支持用户在三维空间中旋转二维矢量图像,并利用生成式AI和深度学习技术即时生成图像的隐藏部分。它显著提升了设计师的工作效率,减少了重复性劳动,适用于平面设计、插画创作、动画制作及游戏开发等领域,同时保持了图像的二维特性和平滑过渡效果。

Remaker

Remaker是一个在线AI工具,专注于创意内容的生成。它利用生成式AI技术,为用户提供了多种功能,包括AI换脸、批量换脸、多人换脸、视频换脸等,满足不同场景下的内容创作需求。

LightRAG

LightRAG是一种由香港大学研究团队设计的检索增强生成系统,融合了图结构索引与双层检索机制,显著提高了大型语言模型的信息检索精度和效率。其核心功能包括复杂查询处理、准确答案生成、动态数据适应以及检索效率优化。通过增量更新算法和实体关系提取技术,LightRAG在多领域如搜索引擎优化、智能客服、个性化推荐、教育科研及医疗咨询中展现出广泛应用前景。

Ev

Ev-DeblurVSR是一款由多所高校联合开发的视频增强模型,利用事件相机数据提升视频去模糊和超分辨率效果。通过互惠特征去模糊模块和混合可变形对齐模块,实现高精度视频恢复。适用于监控、体育、自动驾驶等多个领域,支持快速部署与研究。

Voyage Multimodal

Voyage Multimodal-3 是一款多模态嵌入模型,能够处理文本、图像以及它们的混合数据,无需复杂文档解析即可提取关键视觉特征。它在多模态检索任务中的准确率显著高于现有最佳模型,支持语义搜索和文档理解,适用于法律、金融、医疗等多个领域的复杂文档检索任务。

HourVideo

HourVideo是一项由斯坦福大学研发的长视频理解基准数据集,包含500个第一人称视角视频,涵盖77种日常活动,支持多模态模型的评估。数据集通过总结、感知、视觉推理和导航等任务,测试模型对长时间视频内容的信息识别与综合能力,推动长视频理解技术的发展。其高质量的问题生成流程和多阶段优化机制,使其成为学术研究的重要工具。

Tome

Tome AI是一个利用人工智能来...

Enhance Speech

一款由 Adobe 出品的录音增强工具,可以去除音频背景噪音,让语音或者录音听起来就像在专业录音室中录制一样,使音频具有专业录音室品质录音的干净、专业的声音。

PikFlow

一款由人工智能驱动的让用户能够轻松生成和编辑图像的平台。PikFlow能够理解您的输入并生成图像,应用风格,去除背景,提高分辨率,甚至将2D图像转换为3D模型。

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架,通过生成高质量事故视频并结合自然语言描述与推理,提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强,支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT,AVD2在多项评估中表现优异,为自动驾驶安全提供了重要技术支撑。