深度学习 - 智狐AI导航

PhotoMaker

PhotoMaker V2是腾讯推出的一款AI图像生成框架，能够快速生成逼真的人物照片。它在角色的一致性和可控性上取得了显著进步，用户可以通过文本指令进行精准控制。该工具利用深度学习技术和生成对抗网络（GANs），能够将文本描述转化为图像，并通过集成脚本增强生成过程的个性化和可控性。PhotoMaker V2广泛应用于游戏开发、电影制作、广告、社交媒体、艺术创作和教育等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 879 浏览

Topaz Video AI 4

一家为专业人士提供基于人工智能的照片和视频增强软件的公司。他们的软件利用深度学习来提高图像质量，包括降噪、锐化、提升分辨率等功能。

Ai视频生成 2025年06月05日 49 点赞 0 评论 878 浏览

ART

ART（Anonymous Region Transformer）是一种新型多层透明图像生成技术，支持基于全局文本提示和匿名区域布局生成多个独立透明图层（RGBA格式）。通过逐层区域裁剪机制，显著提升生成效率，速度快于传统方法12倍以上。具备高质量自编码器，支持50层以上的图像生成，减少图层冲突。广泛应用于艺术设计、内容创作、广告营销及科研等领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 877 浏览

Etna模型

一个文字转视频的AIGC模型，Etna能够根据简短的文本描述生成相应的视频内容，支持生成时长为8-15秒的视频，且视频流畅度极高，每秒可达60帧。

Ai视频生成 2025年06月05日 28 点赞 0 评论 875 浏览

URM

URM是由阿里妈妈开发的通用推荐模型，结合大语言模型与电商领域知识，提升推荐效果。其采用多模态融合与Sequence-In-Set-Out生成方式，支持多场景、多目标、长尾及发现性推荐。具备高效率、零样本学习能力，适用于工业级推荐系统，已应用于阿里妈妈展示广告场景，优化用户体验与商家投放效果。

AI项目与工具 2025年06月11日 85 点赞 0 评论 869 浏览

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型，能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型（LRM）设计，采用先进的图像编码、三平面NeRF表示及优化训练策略，支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域，具有高效、高精度和广泛适用性的特点。

AI项目与工具 2025年06月12日 80 点赞 0 评论 867 浏览

PGTFormer是一款先进的视频人脸修复框架，通过解析引导的时间一致性变换器恢复视频中的高保真细节，同时增强时间连贯性。该方法无需预对齐，通过语义解析选择最佳人脸先验，并结合时空Transformer模块和时序保真度调节器，实现了高效且自然的修复效果。其主要功能包括盲视频人脸修复、语义解析引导、时间一致性增强、时空特征提取、端到端修复和时序保真度调节。PGTFormer适用于电影和视频制作、视频

AI项目与工具 2025年06月12日 90 点赞 0 评论 867 浏览

飞桨 | AI Studio

飞桨（PaddlePaddle）以百度多年的深度学习技术研究和业务应用为基础，集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体，是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。

Ai平台模型 2025年06月05日 32 点赞 0 评论 867 浏览

Dawn AI

Dawn AI是一款基于AI技术的图像生成工具，支持文本转图像、多种绘画风格选择以及头像生成等功能。用户可通过输入文字或上传图片，快速生成艺术作品。界面简洁易用，适合各类用户，适用于社交媒体、创意内容制作及角色定制等多种场景，提升创作效率与个性化表达。

AI项目与工具 2025年06月12日 39 点赞 0 评论 866 浏览

MemFree

MemFree是一款开源的混合AI搜索引擎，集成了多种AI技术和搜索引擎功能，支持文本、图像、文件和网页等多种输入形式，可提供文本、思维导图、图片和视频等多格式搜索结果。其核心功能涵盖图像处理、文档总结与提问、学术问题解答、代码解释与生成等，特别适用于学术研究、工作办公和日常生活场景，旨在优化知识管理、提升生产力并降低使用成本。

AI项目与工具 2025年06月12日 42 点赞 0 评论 865 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期