身份 - 智狐AI导航

GOT

创新的OCR模型，它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景，GOT-OCR 2.0都能提供强大的支持。

Ai平台模型 2026年06月29日 0 点赞 0 评论 359 浏览

EMO

EMO通过其先进的音频驱动视频生成技术，为用户带来了一种创新的方式来创造个性化和富有表现力的视频内容。它不仅能够生成逼真的面部表情，还能根据音频内容自然地驱动头部动作，为...

Ai平台模型 2026年06月29日 0 点赞 0 评论 374 浏览

Diffusion Self

Diffusion Self-Distillation (DSD) 是一种基于预训练文本到图像扩散模型的零样本定制图像生成技术，通过自动生成数据集并微调模型，支持文本条件下的图像到图像转换任务。其核心在于利用生成图像网格与视觉语言模型筛选高质量配对数据集，实现无需人工干预的身份保持定制化图像生成。该技术广泛应用于艺术创作、游戏开发、影视制作、广告营销及个性化商品等领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 508 浏览

DynamicFace

DynamicFace是由小红书团队开发的视频换脸技术，结合扩散模型与时间注意力机制，基于3D面部先验知识实现高质量、一致性的换脸效果。通过四种精细的面部条件分解和身份注入模块，确保换脸后的人脸在不同表情和姿态下保持一致性。该技术适用于视频与图像换脸，广泛应用于影视制作、虚拟现实、社交媒体等内容创作领域，具备高分辨率生成能力和良好的时间连贯性。

AI项目与工具 2025年06月12日 84 点赞 0 评论 552 浏览

MyTimeMachine

MyTimeMachine是一款基于深度学习的面部年龄转换工具，支持高质量的年龄回退与进展效果，同时保持个体身份特征。它通过适配器网络结合个性化与全局老化特征，能够生成高分辨率、逼真的静态图像及时间一致的视频老化效果。此外，MyTimeMachine在身份保持、外推能力及视频扩展方面具有显著优势，并广泛应用于影视制作、广告、法医学、历史重现及个人娱乐等领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 562 浏览

DreaMoving是一个基于扩散模型的人类视频生成框架，由阿里巴巴集团研究团队开发。该框架通过视频控制网络（Video ControlNet）和内容引导器（Content Guider）实现对人物动作和外观的精确控制，允许用户通过文本或图像提示生成个性化视频内容。其主要功能包括定制化视频生成、高度可控性、身份保持、多样化的输入方式以及易于使用的架构设计。DreaMoving广泛应用于影视制作、游

AI项目与工具 2024年01月01日 93 点赞 0 评论 571 浏览