增强

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架,通过生成高质量事故视频并结合自然语言描述与推理,提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强,支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT,AVD2在多项评估中表现优异,为自动驾驶安全提供了重要技术支撑。

Epsilla

Epsilla 是一个面向多行业用户的 AI 工具平台,支持通过领域专业知识定制 AI 代理,具备直观的界面和灵活的定制选项,内置检索增强生成(RAG)技术,简化了从概念到生产的 AI 应用部署流程。主要应用于内容生成、投资研究、法律案例分析、客户服务及教育等领域。

Alpha3D

Alpha3D是一款无需3D建模经验的人工智能驱动工具,可将2D图像或文本描述快速转化为3D模型。它支持游戏开发、虚拟现实、增强现实及元宇宙等领域的应用,具备文本到3D、2D到3D模型生成等功能,并可与NVIDIA Omniverse集成,提供从免费到企业级的多种订阅方案。

MimicBrush

MimicBrush是一款由阿里巴巴、香港大学和蚂蚁集团联合研发的AI图像编辑工具,通过参考图像模仿和自动区域识别功能,支持对象替换、样式转换和纹理调整等多种图像编辑操作。它具备实时预览、一键编辑和高度自适应的特点,广泛应用于产品设计、时尚、美容、广告、社交媒体内容创作及电子商务等多个领域。

PartGen

PartGen是一款基于多视图扩散模型的3D对象生成与重建工具,可从文本、图像或现有3D模型生成由意义明确部分组成的三维对象。它具备自动部分分割、3D重建及基于文本指令的部分编辑等功能,广泛应用于3D打印、游戏开发、影视制作等领域,显著提升工作效率并优化用户体验。

UniFab AI

一款可以通过AI算法增强视频和音频质量工具。UniFab AI针对的用户群体主要有老旧视频想要修复和增强、对视频播放有更高要求的影音爱好者。

PicPicAi

PicPicAi是一款集成了多项AI驱动功能的图片编辑工具,支持照片增强、背景移除、物体擦除、老照片修复及黑白照片上色等功能。凭借直观的操作界面和强大的算法支持,它满足了摄影师、社交媒体运营者及内容创作者等群体的专业需求,助力他们快速生成高质量视觉内容。

IMGUpscaler AI

一款免费在线的图片处理工具,支持多种格式,能实现图片放大、增强、锐化、降噪、人像优化、老照片修复等功能,适用于如摄影、电商、社交媒体等多种场景。

Search

Search-o1是由中国人民大学和清华大学联合开发的AI工具,旨在提升大型推理模型在复杂任务中的表现。其核心在于结合RAG机制与Reason-in-Documents模块,实现动态知识检索与精炼处理,增强推理的准确性和连贯性。该工具在科研、数学、编程、问答等多个领域展现出广泛适用性,为构建更可靠的智能系统提供了新路径。

ClearerVoice

ClearerVoice-Studio 是一个基于复数域深度学习算法的开源语音处理框架,集成了语音增强、分离及音视频说话人提取等功能。它通过先进的 FRCRN 和 MossFormer 系列模型,实现了高效的语音信号处理,并具备强大的预训练能力和灵活的接口设计。该框架广泛应用于智能助手、会议记录、电话会议、公共安全等领域,助力提升语音处理技术的实际应用价值。