标记 - 智狐AI导航

在线PS软件

稿定设计PS是一款专业精简的在线ps图片处理软件，PS软件网页版,免下载、免安装，直接在浏览器打开网页版就可随时随地用它修正，调整和美化您的图片。

图片处理 2025年06月05日 48 点赞 0 评论 721 浏览

轻闪PDF

AI驱动的PDF工具，提供编辑、转换、OCR识别、签名、注释、与PDF对话等功能，支持桌面端、移动设备与浏览器访问。

格式转换 2025年06月05日 78 点赞 0 评论 513 浏览

PlayDiffusion

PlayDiffusion是Play AI推出的音频编辑模型，基于扩散模型技术实现音频的精细编辑和修复。它将音频编码为离散标记序列，通过掩码处理和去噪生成高质量音频，保持语音连贯性和自然性。支持局部编辑、高效文本到语音合成、动态语音修改等功能，具有非自回归特性，提升生成速度与质量。适用于配音纠错、播客剪辑、实时语音互动等场景。

AI项目与工具 2025年06月11日 94 点赞 0 评论 751 浏览

MTVCrafter是由中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架，基于4D运动标记化（4DMoT）和运动感知视频扩散Transformer（MV-DiT）实现高质量动画生成。该工具直接对3D运动序列建模，支持泛化到多种角色和风格，保持身份一致性，并在TikTok基准测试中取得优异成绩。其应用场景包括数字人动画、虚拟试穿、沉浸式内

AI项目与工具 2025年06月11日 50 点赞 0 评论 589 浏览

ShotAdapter

ShotAdapter是一款由Adobe与UIUC联合开发的文本到多镜头视频生成框架，通过过渡标记和局部注意力掩码策略，实现角色身份一致性和镜头内容精准控制。支持用户通过文本提示调节镜头数量、时长和背景，适用于影视、广告、教育、游戏等领域，具备高效、灵活和可扩展的技术特点。

AI项目与工具 2025年06月11日 73 点赞 0 评论 461 浏览

UniRig

UniRig是由清华大学计算机系与VAST联合开发的自动骨骼绑定框架，基于自回归模型和交叉注意力机制，可高效生成高质量骨骼结构和蒙皮权重。其支持多种3D模型类型，涵盖动漫角色、有机与无机结构等，广泛应用于动画制作、游戏开发、虚拟角色设计等领域。项目提供开源代码和详细文档，助力提升3D动画制作效率与质量。

AI项目与工具 2025年06月11日 81 点赞 0 评论 521 浏览

Move AI

Move AI 是一款基于AI和计算机视觉的无标记动作捕捉工具，可将普通摄像头拍摄的2D视频转换为高精度3D运动数据。支持实时追踪、多摄像头配置及多种格式导出，适用于影视、游戏、体育分析、VR/AR等领域，提供高效、低成本的解决方案。

AI项目与工具 2025年06月12日 35 点赞 0 评论 666 浏览

SongGen

SongGen是一款由多家高校和研究机构联合开发的单阶段自回归Transformer模型，能够根据文本生成高质量音乐。它支持混合模式和双轨模式输出，可分别生成人声与伴奏，便于后期编辑。SongGen通过创新的音频标记化和训练策略，显著提升了人声清晰度和音乐自然度。其开源特性及高质量数据集为音乐生成研究提供了新基准，适用于音乐创作、视频配乐、教育辅助等多个领域。

AI项目与工具 2025年06月12日 78 点赞 0 评论 638 浏览

FlexTok

FlexTok 是由EPFL与苹果联合开发的图像处理技术，通过将图像转为离散标记序列实现高效压缩与生成。支持8K视频实时渲染，压缩率提升300%，功耗降低45%。具备无损超分辨率重建和灵活图像生成能力，适用于智能家居、安防监控及移动设备等场景。

AI项目与工具 2025年06月12日 70 点赞 0 评论 405 浏览

PartEdit

PartEdit是一种基于预训练扩散模型的细粒度图像编辑工具，通过优化部分标记实现对图像对象各部分的精准定位与编辑。其采用非二进制掩码和自适应阈值策略，确保编辑内容自然融合，保留原始细节。支持真实图像和多部分同时编辑，无需重新训练模型，适用于艺术设计、影视制作、广告等多个领域。

AI项目与工具 2025年06月12日 59 点赞 0 评论 517 浏览

标记

首页

标记

列表

默认

浏览次数

发布日期