深度学习 - 智狐AI导航

AutoConsis

AutoConsis是一款基于深度学习和大型语言模型的UI内容一致性智能检测工具，能够自动识别和提取界面中的关键数据，并对数据一致性进行高效校验。它支持多业务场景适配，具备高泛化性和高置信度，广泛应用于电商、金融、旅游等多个领域，助力提升用户体验和系统可靠性。

AI项目与工具 2025年06月12日 10 点赞 0 评论 693 浏览

LTX Video

LTX Video是一款基于开源架构的AI视频生成工具，利用先进的扩散Transformer技术和2亿参数的DiT架构，能够在短时间内生成高质量视频。其功能涵盖实时生成、运动一致性保障、开源可扩展性及广泛的硬件兼容性，适用于游戏、广告、影视等多种行业，为用户提供高效的视频生成解决方案。

AI项目与工具 2025年06月12日 34 点赞 0 评论 687 浏览

GenChess

GenChess是一款由谷歌DeepMind开发的AI工具，允许用户通过关键词生成个性化国际象棋棋子。它提供了经典与创意两种模式，支持单个棋子的独立调整及对手棋子的自动生成，同时兼容在线对弈和棋子图片下载功能，适用于教育、娱乐、创意表达及专业训练等场景。

AI项目与工具 2025年06月12日 54 点赞 0 评论 546 浏览

Sketch2Lineart

Sketch2Lineart是一款利用人工智能技术将手绘草图转换为清晰线条画的工具。它具备草图转线稿、自动描述生成、细节调整、风格定制及实时预览等功能。通过深度学习和神经网络，该工具能够准确提取草图特征并生成高质量的艺术线条画，适用于艺术创作、产品设计、教育培训及社交媒体内容创作等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 587 浏览

Fancy123

Fancy123是一种基于深度学习的3D网格生成工具，利用单张图像生成高质量3D模型。其核心技术包括多视图扩散模型、大型重建模型、外观增强模块、保真度增强模块及反投影操作，能够有效解决多视图图像的局部不一致问题，提升网格保真度和清晰度。该工具适用于虚拟现实、游戏开发、影视制作等多个领域，具备高度灵活性和实用性。

AI项目与工具 2025年06月12日 55 点赞 0 评论 597 浏览

QwQ

QwQ-32B-Preview是一款由阿里巴巴开发的开源AI推理模型，具有325亿参数，擅长处理数学与编程领域的复杂任务。它能在多个基准测试中超越同类产品，并提供透明化的推理流程。然而，该模型在语言切换及跨领域应用上存在一定局限性。

AI项目与工具 2025年06月12日 99 点赞 0 评论 764 浏览

LongLLaVA是由香港中文大学（深圳）研究团队开发的多模态大型语言模型，结合Mamba和Transformer模块，利用2D池化技术压缩图像token，大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异，特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化，支持多种多模态输入处理，广泛应用于视频分析、医学影像诊断、环境监测等领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 522 浏览

Voice

Voice-Pro是一款开源的多功能音频处理工具，集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等功能，支持超过100种语言，广泛应用于教育、娱乐和商业领域，显著提升音频处理效率和便捷性。

AI项目与工具 2025年06月12日 33 点赞 0 评论 756 浏览

Magic Copy

Magic Copy是一款基于开源技术的AI图像处理工具，支持Chrome浏览器扩展。它利用Meta的Segment Anything Model技术，实现图像中前景对象的自动识别与提取。用户可将提取的内容直接复制到剪贴板或下载保存，广泛应用于设计、教育、电商及办公等领域，提升工作效率。

AI项目与工具 2025年06月12日 35 点赞 0 评论 663 浏览

NSFW Detector

NSFW Detector是一款基于深度学习的开源工具，利用Google的`vit-base-patch16-224-in21k`模型，能够在CPU环境中高效检测图像、PDF、视频及压缩包内的不适宜内容。该工具支持API集成与Docker部署，具备多CPU加速特性，可实现快速且安全的本地化内容分类，广泛应用于社交媒体、内容共享平台、企业网络等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 895 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期