深度学习 - 智狐AI导航

MMAudio

MMAudio是一款基于多模态联合训练的音频合成工具，通过深度学习技术实现视频到音频、文本到音频的精准转换。它具备强大的同步模块，确保生成的音频与视频帧或文本描述时间轴完全对应，适用于影视制作、游戏开发、虚拟现实等多种场景，极大提升了跨模态数据处理的能力和应用效率。

AI项目与工具 2025年06月12日 68 点赞 0 评论 568 浏览

3DTown

3DTown是由哥伦比亚大学联合Cybever AI等机构开发的AI工具，能够从单张俯视图生成高精度的3D城镇场景。它采用区域化生成和空间感知3D修复技术，将输入图像分解为重叠区域，分别生成3D内容并修复缺失结构，确保几何和纹理一致性。支持多种风格的场景生成，适用于虚拟世界构建、游戏开发、机器人模拟等领域，优于现有方法。

AI项目与工具 2025年06月11日 17 点赞 0 评论 565 浏览

HippoRAG 2

HippoRAG 2是俄亥俄州立大学开发的检索增强生成框架，旨在提升RAG系统在模拟人类长期记忆方面的表现。它通过个性化PageRank算法、深度段落整合和知识图谱构建，实现高效的多跳推理与上下文感知检索。系统具备持续学习能力，可实时吸收新知识，适用于智能问答、知识管理、教育、医疗及法律金融等领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 565 浏览

VideoTuna

VideoTuna是一款基于AI的开源视频生成工具，支持文本到视频、图像到视频以及文本到图像的转换。它提供预训练、微调和后训练对齐等功能，兼容U-Net和DiT架构，并计划引入3D视频生成能力。VideoTuna旨在简化视频内容创作流程，提升生成质量与可控性，适用于内容创作、电影制作、广告营销、教育培训等多个领域。

AI项目与工具 2025年06月12日 30 点赞 0 评论 563 浏览

RF

RF-DETR是一款由Roboflow推出的实时目标检测模型，支持多分辨率训练，具备高精度和低延迟特性，在COCO数据集上达到60+ mAP。结合Transformer架构和预训练DINOv2主干，提升领域适应性和检测效果。适用于安防、自动驾驶、工业检测等多个场景，提供预训练检查点以支持快速微调和部署。

AI项目与工具 2025年06月12日 35 点赞 0 评论 563 浏览

喜娜AI助手

喜娜AI助手是新浪财经推出的智能工具，具备AI摘要和个股公告解读两大功能。AI摘要可快速提炼财经新闻核心信息，帮助用户高效掌握公司业务、财务状况及行业动态；个股公告解读则基于深度学习技术，对A股公告进行专业分析，识别关键数据并用可视化方式标注风险与机会，提升信息理解效率，助力用户做出更明智的投资决策。

AI项目与工具 2025年06月12日 27 点赞 0 评论 563 浏览

纸质书:《动手学深度学习》

全球60多个国家400多所大学用于教学

Ai编程建站 1970年01月01日 0 点赞 0 评论 559 浏览

Mellum

Mellum 是 JetBrains 推出的一款专为开发者设计的大型语言模型（LLM），通过深度集成 JetBrains IDE，提供低延迟、高精度的代码补全服务，支持多种编程语言，显著提升开发效率。其训练数据仅限于公开可用且许可宽松的代码，保障用户隐私。

AI项目与工具 2025年06月12日 85 点赞 0 评论 558 浏览

PersonaMagic

PersonaMagic 是一种基于文本条件策略的人脸生成技术，通过动态嵌入学习和双平衡机制实现高保真个性化图像生成。该工具可依据文本提示调整人脸风格、表情和背景，同时保持身份特征。支持单图像训练，降低数据需求，并可与其他模型结合使用。实验显示其在文本对齐和身份保持方面表现优异，适用于娱乐、游戏、影视及营销等多个领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 558 浏览

AIGCPanel

AIGCPanel是一款开源的AI数字人系统，支持视频合成、声音合成与声音克隆等功能。它利用自然语言处理、计算机视觉技术和深度学习算法，实现高质量的音视频同步和自然语音生成。系统具有多语言支持、模型管理和日志查看功能，可应用于影视制作、虚拟主播、教育培训等多个领域。

AI项目与工具 2025年06月12日 69 点赞 0 评论 558 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期