计算

PhysGen3D

PhysGen3D 是一款能够将单张图像转换为交互式 3D 场景并生成物理真实视频的工具。它结合图像分析与物理模拟技术,支持精确控制物体属性、动态效果整合及高质量渲染。适用于影视、VR/AR、教育、游戏和广告等多个领域,提供高效且逼真的视觉内容生成能力。

PC Agent

PC Agent是一款基于人工智能的多功能系统,通过模拟人类认知过程,实现复杂数字任务的自动化处理,包括文档编辑、数据分析、项目管理和客户服务等。它采用多智能体系统架构,结合PC Tracker采集的人机交互数据,利用两阶段认知完成流程生成富含认知信息的轨迹,从而支持高效的决策制定与任务执行。

DistriFusion

DistriFusion是一个专为加速高分辨率扩散模型在多GPU环境中生成图像的分布式并行推理框架。通过将图像分割成多个小块并分配至不同设备上进行独立处理,它能够在不增加额外训练负担的情况下,将推理速度提升高达六倍,同时保持图像质量。其技术原理包括Patch Parallelism(分片并行)、异步通信、位移补丁并行性等,适用于多种现有的扩散模型。应用场景包括AI艺术创作、游戏和电影制作、VR/A

电子科技大学计算机科学与工程学院

学院有计算机科学与技术(智能金融与区块链金融“双A”联合学位实验班)、计算机科学与技术(“互联网+”复合型精英人才双学位培养计划)、人工智能、计算机类(计算机科学与技术、网络...

FlashVideo

FlashVideo是由字节跳动团队研发的高分辨率视频生成框架,采用两阶段方法优化计算效率。第一阶段在低分辨率下生成高质量内容,第二阶段通过流匹配技术提升至1080p,仅需4次函数评估。其特点包括高效计算、细节增强、快速预览及多场景应用,适用于广告、影视、教育等领域。

Delta

Delta-CoMe是一种由清华大学NLP实验室牵头研发的增量压缩算法,它通过低秩分解与混合精度量化技术,显著减少了大型语言模型的存储和内存需求,同时保持了模型性能几乎无损。该工具支持多任务处理、推理加速,并广泛适用于云计算、边缘计算及学术研究等领域,特别擅长应对数学、代码和多模态任务。

DynamicCity

DynamicCity是由上海AI Lab开发的大规模动态场景生成框架,支持高质量4D LiDAR场景的生成与重建,适用于自动驾驶、机器人导航、虚拟现实等多个领域。该框架基于VAE和DiT模型,实现高效的场景编码与生成,支持轨迹引导、指令驱动生成和动态修复等多种应用,展现出优异的性能和广泛的应用潜力。

灵犀 X2

灵犀 X2 是智元机器人推出的双足人形机器人,具备 28 个自由度和高灵活性,可完成跳舞、奔跑、骑车等复杂动作。搭载 Diffusion 动作生成引擎和多模态交互系统,支持情感识别与毫秒级响应。适用于家庭服务、教育、医疗护理、工业协作及娱乐场景,具备强大的环境感知与任务执行能力。

RightNow AI

RightNow AI 是一款专注于 CUDA 代码优化的 AI 工具,能够自动分析并提升 GPU 性能。它支持多种 NVIDIA GPU 架构,提供无服务器的性能分析服务,并允许用户通过自然语言指令生成高性能代码。适用于模型训练、科学计算、金融建模等多个领域,显著降低 GPU 编程门槛,提升计算效率。