深度学习 - 智狐AI导航

InvSR

InvSR是一款基于扩散模型逆过程开发的图像超分辨率工具，通过深度噪声预测器和灵活采样机制，从低分辨率图像恢复高质量高分辨率图像。它支持多种应用场景，包括文化遗产保护、视频监控、医疗成像及卫星影像分析，同时兼顾计算效率与性能表现。

AI项目与工具 2025年06月12日 14 点赞 0 评论 779 浏览

VisionFM

VisionFM是一款专为眼科设计的多模态多任务视觉基础模型，通过大规模预训练支持多种眼科成像模态处理，涵盖疾病筛查、诊断、预后预测、表型细分及全身性生物标志物分析等功能。其在疾病诊断上的表现超越了大部分眼科医生，并具备强大的泛化能力和少样本学习能力。

AI项目与工具 2025年06月12日 83 点赞 0 评论 446 浏览

Manga Image Translator

Manga Image Translator 是一个开源的漫画图片文字翻译工具，基于 OCR 和机器翻译技术，实现对漫画和图片中文字的自动识别与翻译。它支持多语言翻译，包括日文、中文、英文和韩文，并具备图像合成能力，保持原图风格。工具提供批量处理和在线/离线翻译功能，适用于漫画爱好者、语言学习者以及出版商等用户群体。

AI项目与工具 2025年06月12日 16 点赞 0 评论 544 浏览

Bocha Semantic Reranker

Bocha Semantic Reranker是一款基于语义的排序模型，用于提升搜索和问答系统的准确性。它通过二次优化初步排序结果，评估查询与文档的语义相关性，并为文档分配语义得分。该工具支持多种语言模型，适用于搜索引擎优化、问答系统、推荐系统和智能客服等领域，旨在改善用户体验并提高系统效率。

AI项目与工具 2025年06月12日 15 点赞 0 评论 739 浏览

Change Clothes AI

Change Clothes AI是一款利用深度学习技术的在线虚拟试衣平台，用户上传个人照片与服装图片后，可快速生成逼真的试穿效果图。该工具支持多种服装风格的自由搭配，并提供高效的图像生成服务，适用于个人购物体验、电商展示、时尚内容创作及设计优化等场景。

AI项目与工具 2025年06月12日 43 点赞 0 评论 765 浏览

MMAudio

MMAudio是一款基于多模态联合训练的音频合成工具，通过深度学习技术实现视频到音频、文本到音频的精准转换。它具备强大的同步模块，确保生成的音频与视频帧或文本描述时间轴完全对应，适用于影视制作、游戏开发、虚拟现实等多种场景，极大提升了跨模态数据处理的能力和应用效率。

AI项目与工具 2025年06月12日 68 点赞 0 评论 568 浏览

ChatTTSPlus

ChatTTSPlus 是一款基于深度学习的语音合成工具，它通过 TensorRT 技术实现了显著的性能提升，同时支持语音克隆、模型压缩与加速等功能。该工具不仅适用于桌面端，还能够部署于移动设备，满足多种应用场景需求，包括有声读物制作、语言学习辅助、客户服务及娱乐等领域。 ---

AI项目与工具 2025年06月12日 13 点赞 0 评论 716 浏览

Gemini 2.0

Gemini 2.0 是谷歌推出的原生多模态AI模型，具备快速处理文本、音频和图像的能力，支持多语言输出和实时音视频流输入。通过Agent技术和工具调用，Gemini 2.0 能够自主理解任务并提供解决方案，已在编程、数据分析、游戏等领域展示应用潜力。目前提供免费试用，计划逐步开放更多功能。

AI项目与工具 2025年06月12日 63 点赞 0 评论 438 浏览

塔猫AI对话PPT

塔猫AI对话PPT是一款利用深度学习与自然语言处理技术的智能PPT分析工具，可解析文本、图表等内容，支持智能问答、摘要生成及逻辑优化建议等功能。它适用于信息检索、演讲准备、教育培训等多个场景，助力用户高效获取所需信息。

AI项目与工具 2025年06月12日 98 点赞 0 评论 482 浏览

OOTDiffusion

OOTDiffusion是一款开源AI虚拟试衣工具，支持根据用户上传的模特和服装图片生成自然贴合的试穿效果，具有智能适配、多种试穿模式及快速生成等特点。它通过预训练扩散模型、Outfitting UNet、Outfitting Fusion等技术实现高质量服装图像生成，适用于电商、设计、定制服务等多个领域。

AI项目与工具 2025年06月12日 81 点赞 0 评论 646 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期