增强 - 智狐AI导航

Matryoshka Diffusion Models

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的创新扩散模型，专为生成高分辨率图像和视频而设计。通过多尺度扩散机制与NestedUNet架构，MDM实现了高效的信息共享与渐进式训练，显著提升了模型的训练效率与生成质量。该模型适用于资源受限的环境，可减少训练步骤并保持生成图像的细节与清晰度。其主要功能包括高分辨率图像生成、多分辨率处理、特征共享以及渐进式训练

AI项目与工具 2025年06月12日 18 点赞 0 评论 741 浏览

Wonder Animation

Wonder Animation是一款基于AI的视频到3D场景转换工具，由Autodesk的Wonder Dynamics研发。它能够将视频序列转化为包含摄像机设置和角色动画的3D动画场景，支持多剪辑和多种镜头处理。通过深度学习和计算机视觉技术，Wonder Animation在3D空间中重建场景，并确保动作和场景的高度同步与一致。此工具特别适合动画电影制作、视频游戏开发、虚拟制作以及增强现实和虚

AI项目与工具 2025年06月12日 43 点赞 0 评论 742 浏览

libcom

libcom是一款由上海交通大学BCMI实验室开发的图像合成工具箱，支持图像融合、和谐化、阴影生成、对象放置及生成式合成等功能，采用传统图像处理与深度学习技术相结合的方式，提供高质量的合成图像解决方案。适用于增强现实、艺术创作、电子商务、影视制作及游戏开发等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 744 浏览

Wavy

Wavy是一款利用AI技术的照片编辑工具，可将普通照片转换为具有艺术风格的作品。它提供多种功能，包括AI艺术生成、图像放大、照片优化以及对象移除等，适用于个人摄影、社交媒体内容创作、艺术设计等多个场景，帮助用户实现创意表达与个性化展示。

AI项目与工具 2025年06月12日 73 点赞 0 评论 745 浏览

APISR

一个专注于动漫图像超分辨率的项目，旨在恢复和增强来自现实世界场景的低质量、低分辨率动漫图像和视频源。

Ai开源项目 2025年06月05日 14 点赞 0 评论 745 浏览

PSHuman

PSHuman是一款基于跨尺度多视图扩散模型的单图像3D人像重建工具，仅需一张照片即可生成高保真度的3D人体模型，支持全身姿态和面部细节的精确重建。其核心技术包括多视角生成、SMPL-X人体模型融合及显式雕刻技术，确保模型在几何和纹理上的真实感。该工具适用于影视、游戏、VR/AR、时尚设计等多个领域，具备高效、精准和易用的特点。

AI项目与工具 2025年06月12日 49 点赞 0 评论 745 浏览

VMB

VMB是一个由多机构合作研发的多模态音乐生成框架，可从文本、图像和视频等多样化输入生成音乐。它通过文本桥接和音乐桥接优化跨模态对齐与可控性，显著提高了音乐生成的质量和定制化程度。VMB具有增强模态对齐、提升可控性、显式条件生成等特点，适用于电影、游戏、虚拟现实等多个领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 746 浏览

pixble

Pixble 是一款利用 AI 技术的在线照片编辑平台，可自动优化照片的光线、色彩和清晰度，同时具备降噪和锐化功能。它支持多种应用场景，如营销、电商、房地产及创意设计，并提供 Face Swap 等趣味性功能。Pixble 的 API 还便于开发者集成其服务，是一款高效易用的工具。

AI项目与工具 2025年06月12日 99 点赞 0 评论 748 浏览

FLOAT

FLOAT是一款基于音频驱动的虚拟人像生成模型，利用运动潜在空间和流匹配技术，实现时间一致性视频生成。它支持情感增强，生成自然且富有表现力的虚拟人物，广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域，同时具备高效的采样和生成能力。

AI项目与工具 2025年06月12日 18 点赞 0 评论 749 浏览

LongCite

LongCite是清华大学研发的一项旨在提升大型语言模型在长文本问答中可信度和可验证性的项目。它通过生成细粒度的句子级引用，帮助用户验证模型回答的准确性。LongCite包含LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集，以及基于该数据集训练的模型。这些模型能够处理长文本内容，提供准确的问答服务，并附带可追溯的引用，增强信息的透明度和可靠性。

AI项目与工具 2025年06月12日 10 点赞 0 评论 753 浏览

增强

首页

增强

列表

默认

浏览次数

发布日期