深度学习 - 智狐AI导航

IMAGPose

IMAGPose是由南京理工大学开发的统一条件框架，用于人体姿态引导的图像生成。其核心功能包括多场景适应、细节与语义融合、灵活对齐及全局一致性保障。通过FLC、ILC和CVA模块，解决了传统方法在生成多样姿态图像时的局限性，适用于虚拟现实、影视制作、电商展示等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 630 浏览

Colorize Photos

一个基于AI的在线智能转换工具。使用AI为照片着色，在几秒钟内将黑白图片转换为彩色。

Ai图片处理 2025年06月05日 63 点赞 0 评论 630 浏览

Claude Dev

Claude Dev 是一款基于 Claude 3.5 Sonnet 模型的 AI 编程助手，专为 Visual Studio Code 设计。它支持自动化处理复杂编程任务，包括文件操作、代码生成、项目初始化等，并通过实时监控资源消耗和智能权限管理保障安全性。此外，其互动式开发辅助功能和直观界面显著提升了代码编写与项目管理的效率，适用于教育、游戏开发及专业编程等多个领域。

AI项目与工具 2025年06月12日 97 点赞 0 评论 632 浏览

VideoRefer

VideoRefer是由浙江大学与阿里达摩院联合开发的视频对象感知与推理系统，基于增强型视频大型语言模型，实现对视频中对象的细粒度理解与分析。其核心包括大规模视频数据集、多功能空间-时间编码器和全面评估基准，支持对象识别、关系分析、推理预测及多模态交互等功能，适用于视频剪辑、教育、安防、机器人控制和电商等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 632 浏览

dots.llm1 是小红书 hi lab 开源的中等规模 Mixture of Experts（MoE）文本大模型，拥有 1420 亿参数，激活参数为 140 亿。模型在 11.2T 高质量 token 数据上预训练，采用高效的 Interleaved 1F1B 流水并行和 Grouped GEMM 优化技术，提升训练效率。该模型支持多语言文本生成、复杂指令遵循、知识问答、数学与代码推理以及多轮

AI项目与工具 2025年06月11日 78 点赞 0 评论 632 浏览

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音（TTS）工具，支持多语言文本输入，通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力，延迟时间短，无需依赖音素，泛化性强，且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 633 浏览

FlashMLA

FlashMLA 是 DeepSeek 开发的开源 MLA 解码内核，针对 NVIDIA Hopper 架构 GPU 优化，提升可变长度序列处理效率。支持 BF16 精度、页式 KV 缓存及分块调度，内存带宽达 3000 GB/s，算力达 580 TFLOPS。适用于大语言模型推理和 NLP 任务，具备高性能与低延迟特性，支持快速部署与性能验证。

AI项目与工具 2025年06月12日 12 点赞 0 评论 634 浏览

字体家AI神笔

叶根友字体与字体家AI神笔团队共同出品的AI造字系统

Ai绘画生成 1970年01月01日 0 点赞 0 评论 634 浏览

AI算法工程师-必备基础与机器学习

706课时帮助学生打下坚实的基础，为进一步学习人工智能和深度学习做好准备。

Ai学习资源 1970年01月01日 0 点赞 0 评论 637 浏览

丰语大模型

丰语大模型是由顺丰科技研发的一款针对物流行业的专用大型语言模型。其主要功能包括提高客服对话摘要的准确率、优化客户服务流程、为快递员提供实时问答支持、辅助国际物流清关流程、以及在退货和风控中自动识别和处理订单。丰语大模型基于自然语言处理、深度学习、迁移学习和监督学习技术，广泛应用于市场营销、客户服务、快递收派和国际物流等领域，显著提升了物流服务的整体效率和质量。

AI项目与工具 2025年06月12日 73 点赞 0 评论 638 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期