深度学习 - 智狐AI导航

GLM

GLM-4-Flash是一款由智谱AI开发的免费大模型API，具备强大的多轮对话、多语言处理能力以及网页检索和代码执行等功能。它利用深度学习技术，尤其是Transformer架构，来实现高效的语言处理和生成。该工具广泛应用于客户服务、内容创作、语言翻译、教育辅助和编程辅助等多个领域，为用户提供了一个全面而高效的AI解决方案。

AI项目与工具 2025年06月12日 34 点赞 0 评论 533 浏览

EasyOCR

EasyOCR是一款基于深度学习技术的开源OCR工具，支持超过80种语言及多种书写系统。它提供高精度的文字识别能力，用户可通过简单的API轻松地将图像中的文本转换为可编辑的文本。EasyOCR易于安装和使用，支持跨平台操作，并具备批量处理能力。该工具在图像质量有一定要求的情况下，能够高效处理大量图像文件。

AI项目与工具 2025年06月12日 89 点赞 0 评论 680 浏览

STranslate

STranslate是一款面向Windows用户的多功能翻译和OCR工具，支持多种语言翻译，包括划词、截图和监听剪贴板等多种方式，并集成了多家翻译服务接口。它还具备基于PaddleOCR技术的离线OCR功能，支持中文、英文、日文和韩文的识别。此外，该工具还具备快捷键操作、历史记录和在线升级等功能，是提高工作效率的理想工具。

AI项目与工具 2025年06月12日 10 点赞 0 评论 709 浏览

Eagle

Eagle是一个由英伟达开发的多模态大模型，专长于处理高分辨率图像，提高视觉问答和文档理解能力。该模型采用多专家视觉编码器架构，通过简单的特征融合策略实现图像内容的深入理解。Eagle模型已开源，适用于多个行业，具有高分辨率图像处理、多模态理解、多专家视觉编码器、特征融合策略和预对齐训练等特点。

AI项目与工具 2025年06月12日 38 点赞 0 评论 533 浏览

PGTFormer是一款先进的视频人脸修复框架，通过解析引导的时间一致性变换器恢复视频中的高保真细节，同时增强时间连贯性。该方法无需预对齐，通过语义解析选择最佳人脸先验，并结合时空Transformer模块和时序保真度调节器，实现了高效且自然的修复效果。其主要功能包括盲视频人脸修复、语义解析引导、时间一致性增强、时空特征提取、端到端修复和时序保真度调节。PGTFormer适用于电影和视频制作、视频

AI项目与工具 2025年06月12日 90 点赞 0 评论 765 浏览

Yi

Yi-Coder是一款由零一万物开发的开源AI编程助手，支持52种主流编程语言，能够处理长达128K tokens的上下文。它在多个代码生成基准测试中表现优异，尤其在LiveCodeBench平台上的表现尤为突出。Yi-Coder在代码编辑和补全方面也有卓越的表现，适用于各种开发项目，帮助开发者提高工作效率。 ---

AI项目与工具 2025年06月12日 80 点赞 0 评论 640 浏览

CodeFormer

CodeFormer是一款由南洋理工大学和商汤科技合作开发的AI照片和视频修复工具。它利用变分自动编码器（VQGAN）和Transformer技术，能够对模糊和马赛克处理过的照片或视频进行高质量修复。CodeFormer支持图片和视频的高清修复，操作简便且为开源免费软件，适用于家庭相册修复、社交媒体照片优化及专业图像处理等多种场景。

AI项目与工具 2025年06月12日 24 点赞 0 评论 626 浏览

Kolors Virtual Try

Kolors Virtual Try-On 是一款基于深度学习技术的 AI 虚拟换衣工具，能够分析用户上传的照片并智能适配服装，生成逼真的试穿效果。主要功能包括 AI 虚拟换衣、自动适配光线和阴影、支持多种服装和风格、快速生成效果图以及个性化试穿体验。该工具适用于在线购物、时尚搭配、内容创作和电商营销等多种应用场景。

AI项目与工具 2025年06月12日 30 点赞 0 评论 499 浏览

Deepfake Defenders

Deepfake Defenders 是一个由中国科学院自动化研究所的 VisionRush 团队开发的开源 AI 模型，主要用于检测和防御 Deepfake 技术生成的伪造图像和视频。它通过分析媒体内容中的细微像素变化来识别伪造内容，并提供像素级分析、实时检测等功能。该模型采用卷积神经网络（CNN）、生成对抗网络（GAN）等技术，支持多模态分析，具备开源协作特性，广泛应用于社交媒体监控、新闻验证

AI项目与工具 2025年06月12日 20 点赞 0 评论 638 浏览

MagicMan

MagicMan是由多个顶尖研究机构联合开发的AI工具，主要功能是从单张2D图像生成高质量的3D人类模型。它结合了预训练的2D扩散模型和参数化的SMPL-X模型，并通过混合多视角注意力机制和迭代细化策略，实现精确的3D感知和图像生成。MagicMan在游戏、电影、虚拟现实、时尚、零售和教育等多个领域有广泛应用，能够显著提高角色设计的真实感和多样性。

AI项目与工具 2025年06月12日 55 点赞 0 评论 690 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期

GLM