计算机视觉

寒武纪

打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片

创作工具 1970年01月01日 0 点赞 0 评论 523 浏览

Easegen 是一款开源的 AI 工具，支持数字人课程的制作与管理。它能够批量生成 PPT 课件、克隆数字人形象和声音，并通过 AI 技术实现视频渲染和智能出题。其核心功能包括课程制作、视频管理、智能课件生成、数字人克隆及声音克隆，旨在提升教学内容的互动性和趣味性。Easegen 的技术基础涵盖人工智能、计算机视觉、自然语言处理和语音合成等，适用于在线教育、企业培训、学术研究、语言学习及职业培训

AI项目与工具 2025年06月12日 45 点赞 0 评论 509 浏览

FluxSR

FluxSR是一种基于单步扩散模型的图像超分辨率工具，由多所高校与研究机构联合开发。它通过流轨迹蒸馏技术，将多步模型压缩为单步模型，实现高效且高质量的图像增强。采用TV-LPIPS感知损失和注意力多样化损失，有效提升图像细节并减少伪影。适用于老照片修复、影视制作、医学影像增强等多个领域，具备高性能与低计算成本优势。

AI项目与工具 2025年06月12日 24 点赞 0 评论 509 浏览

AutoTrain

AutoTrain是一款由Hugging Face开发的无代码平台，支持用户通过上传数据快速创建和部署定制化的AI模型。它涵盖多种机器学习任务，如文本分类、图像识别及表格数据分析，并提供自动化的数据预处理、分布式训练、超参数优化等功能，适用于自然语言处理、计算机视觉等多个领域。其核心优势在于简化了模型训练流程，使非技术人员也能高效构建高质量模型。 ---

AI项目与工具 2025年06月12日 30 点赞 0 评论 508 浏览

MAETok

MAETok是一种基于掩码建模的图像标记化方法，通过自编码器结构学习更具语义丰富性的潜在空间，提升图像生成质量与训练效率。它支持高分辨率图像生成，具备多特征预测能力和灵活的潜在空间设计，适用于娱乐、数字营销、计算机视觉等多个领域。实验表明其在ImageNet数据集上表现优异。

AI项目与工具 2025年06月12日 67 点赞 0 评论 506 浏览

DynamicCity

DynamicCity是由上海AI Lab开发的大规模动态场景生成框架，支持高质量4D LiDAR场景的生成与重建，适用于自动驾驶、机器人导航、虚拟现实等多个领域。该框架基于VAE和DiT模型，实现高效的场景编码与生成，支持轨迹引导、指令驱动生成和动态修复等多种应用，展现出优异的性能和广泛的应用潜力。

AI项目与工具 2025年06月12日 63 点赞 0 评论 487 浏览

PhysGen3D

PhysGen3D 是一款能够将单张图像转换为交互式 3D 场景并生成物理真实视频的工具。它结合图像分析与物理模拟技术，支持精确控制物体属性、动态效果整合及高质量渲染。适用于影视、VR/AR、教育、游戏和广告等多个领域，提供高效且逼真的视觉内容生成能力。

AI项目与工具 2025年06月12日 51 点赞 0 评论 483 浏览

ShowMeAI

ShowMeAI知识社区是一个资源丰富、易于访问的平台，适合所有希望深入了解和掌握人工智能技术的人士。

Ai编程建站 1970年01月01日 0 点赞 0 评论 467 浏览

Junlala AI

Junlala AI 是一家专注于人工智能领域的公司。我们汇聚了行业内顶尖专家和高级工程师，致力于研发尖端的人工智能算法和解决方案。

AI服务商 2025年06月05日 100 点赞 0 评论 447 浏览

Florence

Florence-2是微软Azure AI团队研发的多功能视觉模型，支持图像描述、目标检测、视觉定位和图像分割等功能。该模型基于Transformer架构，采用序列到序列学习方法，利用自注意力机制实现多模态信息融合。通过训练大规模数据集，Florence-2在多个应用场景中表现出色，包括图像和视频分析、内容审核、辅助驾驶、医疗影像分析以及零售和库存管理。

AI项目与工具 2025年06月12日 67 点赞 0 评论 444 浏览

计算机视觉

首页

计算机视觉

列表

默认

浏览次数

发布日期

寒武纪

easegen