深度学习 - 智狐AI导航

Plask

Plask，一种基于 Web 的 AI 解决方案，用于生成生成具有定制姿势和角度的3D 图像。而无需花费数小时在绘图、摆姿势和渲染上。

3D&游戏 2025年06月05日 40 点赞 0 评论 766 浏览

PGTFormer是一款先进的视频人脸修复框架，通过解析引导的时间一致性变换器恢复视频中的高保真细节，同时增强时间连贯性。该方法无需预对齐，通过语义解析选择最佳人脸先验，并结合时空Transformer模块和时序保真度调节器，实现了高效且自然的修复效果。其主要功能包括盲视频人脸修复、语义解析引导、时间一致性增强、时空特征提取、端到端修复和时序保真度调节。PGTFormer适用于电影和视频制作、视频

AI项目与工具 2025年06月12日 90 点赞 0 评论 766 浏览

月之暗面Moonshot AI

一家专注于人工智能技术的公司，由杨植麟于2023年3月创立。公司致力于开发大型AI模型，其核心产品是Kimi智能助手。

Ai科技公司 2025年06月05日 50 点赞 0 评论 769 浏览

ART

ART（Anonymous Region Transformer）是一种新型多层透明图像生成技术，支持基于全局文本提示和匿名区域布局生成多个独立透明图层（RGBA格式）。通过逐层区域裁剪机制，显著提升生成效率，速度快于传统方法12倍以上。具备高质量自编码器，支持50层以上的图像生成，减少图层冲突。广泛应用于艺术设计、内容创作、广告营销及科研等领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 769 浏览

VisoMaster

VisoMaster 是一款基于 AI 的面部编辑与换脸工具，支持图片、视频及直播场景，能生成自然逼真的换脸效果。采用 GPU 加速与自定义模型功能，适用于影视、广告、视频创作等领域。核心技术包括深度学习与 GANs，实现高精度面部特征提取与图像合成，支持实时预览与参数调整，提升用户体验与效率。

AI项目与工具 2025年06月12日 82 点赞 0 评论 770 浏览

MatAnyone

MatAnyone是一款由南洋理工大学S-Lab实验室与商汤科技联合开发的视频抠图框架，专注于复杂背景下人像视频的精准分割。采用一致内存传播和区域自适应内存融合技术，确保视频中目标的语义稳定性和边界细节精度。结合大规模分割数据和优化的训练策略，提升了模型在真实场景下的性能。适用于影视制作、直播、广告、游戏开发等多个领域，具备高精度、强适应性和良好的交互性。

AI项目与工具 2025年06月12日 48 点赞 0 评论 775 浏览

EasyControl

EasyControl是基于扩散变换器（DiT）架构的高效控制框架，采用轻量级LoRA模块实现多条件控制，支持图像生成、风格转换、动画制作等任务。其具备位置感知训练范式和因果注意力机制，优化计算效率，提升生成质量与灵活性，适用于多种图像处理场景。

AI项目与工具 2025年06月12日 48 点赞 0 评论 777 浏览

URM

URM是由阿里妈妈开发的通用推荐模型，结合大语言模型与电商领域知识，提升推荐效果。其采用多模态融合与Sequence-In-Set-Out生成方式，支持多场景、多目标、长尾及发现性推荐。具备高效率、零样本学习能力，适用于工业级推荐系统，已应用于阿里妈妈展示广告场景，优化用户体验与商家投放效果。

AI项目与工具 2025年06月11日 85 点赞 0 评论 777 浏览

飞扬Ai助手

专注于工作交付场景的AI助手，像巴黎欧莱雅一样值得拥有！

创作工具 1970年01月01日 0 点赞 0 评论 778 浏览

Multi

Multi-Speaker 是 AudioShake 推出的高分辨率多说话人分离工具，支持将音频中不同说话人的语音精准分离至独立轨道，适用于广播级音频处理。它具备高保真音频处理能力，支持高采样率，能处理长达数小时的录音，在复杂场景下仍能保持稳定效果。广泛应用于影视、播客、无障碍服务及内容创作等领域，提升音频编辑效率与质量。

AI项目与工具 2025年06月12日 55 点赞 0 评论 778 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期