深度学习 - 智狐AI导航

ClearerVoice

ClearerVoice-Studio 是一个基于复数域深度学习算法的开源语音处理框架，集成了语音增强、分离及音视频说话人提取等功能。它通过先进的 FRCRN 和 MossFormer 系列模型，实现了高效的语音信号处理，并具备强大的预训练能力和灵活的接口设计。该框架广泛应用于智能助手、会议记录、电话会议、公共安全等领域，助力提升语音处理技术的实际应用价值。

AI项目与工具 2025年06月12日 81 点赞 0 评论 713 浏览

GenieArt

一个基于深度学习的AI文本到图像生成模型，GenieArt主要用于生成以文本描述为条件的详细图像和插画。在这里您可以享受低门槛地创作，所想即所得，方便快捷地展现您脑海里的画卷

Ai绘画生成 2025年06月05日 44 点赞 0 评论 714 浏览

ChatTTSPlus

ChatTTSPlus 是一款基于深度学习的语音合成工具，它通过 TensorRT 技术实现了显著的性能提升，同时支持语音克隆、模型压缩与加速等功能。该工具不仅适用于桌面端，还能够部署于移动设备，满足多种应用场景需求，包括有声读物制作、语言学习辅助、客户服务及娱乐等领域。 ---

AI项目与工具 2025年06月12日 13 点赞 0 评论 716 浏览

机器之心

机器之心是中国领先的人工智能科技媒体，提供最新的AI新闻、研究论文和产业动态，专业的人工智能信息服务平台。

媒体资讯 2025年06月05日 23 点赞 0 评论 716 浏览

SHMT

SHMT是一种基于自监督学习的高级化妆转移技术，由阿里巴巴达摩院与武汉理工大学联合研发。该技术无需成对训练数据，可将多种化妆风格自然迁移到目标面部图像上，通过“解耦-重建”策略和迭代双重对齐模块，实现高精度的纹理控制与对齐校正。适用于图像处理、虚拟试妆、影视设计等多个领域，具有高效、灵活、高质量的特点。

AI项目与工具 2025年06月12日 32 点赞 0 评论 717 浏览

MisoraAI

Misora AI是一款集成了深度学习与自然语言处理技术的智能搜索引擎，具备快速搜索、精准匹配及自然语言交互等功能。它不仅能为用户提供即时的文本查询结果，还能生成创意内容如诗歌、故事等，并支持图像描述服务。Misora AI适用于多种场景，包括日常信息查询、学术研究、工作辅助以及娱乐资讯获取，为用户提供了便捷高效的智能化解决方案。

AI项目与工具 2025年06月12日 51 点赞 0 评论 719 浏览

DAMODEL

DAMODEL是一个基于GPU算力的AI开发云平台，支持多种主流AI框架和高性能GPU配置，提供开箱即用的开发环境和便捷的数据管理功能。平台具备可视化操作界面、JupyterLab在线访问及多种预置模型，适用于大模型训练、深度学习、数据科学和图像处理等多种应用场景。

AI项目与工具 2025年06月11日 19 点赞 0 评论 719 浏览

MangaNinja

MangaNinja是一款基于参考图像的线稿上色工具，采用Reference U-Net和Denoising U-Net架构，结合补丁重排模块与点驱动控制方案，实现高精度、细粒度的上色效果。其可处理复杂场景、多参考图像协调及极端姿势等问题，广泛应用于漫画创作、插画设计、平面设计和数字艺术等领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 719 浏览

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架，通过生成高质量事故视频并结合自然语言描述与推理，提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强，支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT，AVD2在多项评估中表现优异，为自动驾驶安全提供了重要技术支撑。

AI项目与工具 2025年06月12日 62 点赞 0 评论 722 浏览

VeoGo AI

VeoGo AI 是一款基于深度学习的短视频流量预测工具，可提前分析视频表现并提供优化建议，帮助创作者提升曝光与点击率。支持多平台算法适配，涵盖内容结构、画面构图、剪辑节奏、BGM选择等全方位优化指导，预测准确率超92%，适用于短视频创作与效率提升场景。

AI项目与工具 2025年06月11日 33 点赞 0 评论 722 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期