深度学习 - 智狐AI导航

PaddleOCR 2.9

PaddleOCR 2.9 是一个基于深度学习的开源 OCR 工具库，提供了强大的文本识别、版面分析和信息抽取功能。支持多语言识别和多种硬件平台，通过低代码开发模式简化了模型的部署和定制，广泛应用于文档数字化、智能办公、身份验证、物流管理和金融服务等领域。

AI项目与工具 2025年06月12日 56 点赞 0 评论 723 浏览

Surya

Surya是一款开源OCR工具包，专注于文档识别，支持90多种语言的文本提取与分析。它能够识别文档中的文本、表格、图片及标题等布局元素，并确保文本阅读顺序的准确性。凭借其高效的表格识别能力和优化的算法，Surya在处理复杂文档时表现出色，广泛应用于文档数字化、数据提取、多语言处理以及学术研究等领域。 ---

AI项目与工具 2025年06月12日 16 点赞 0 评论 724 浏览

Avatar IV

Avatar IV 是 HeyGen 推出的 AI 数字人模型，支持用户通过上传照片和语音快速生成逼真视频。该工具基于音频驱动的表情引擎，能精准捕捉语音中的语调、节奏和情感，生成自然流畅的面部表情和动作。操作简单，无需专业技能，适用于多种角色形象，涵盖社交媒体、企业营销、在线教育等多个领域，是高效内容创作的理想选择。

AI项目与工具 2025年06月11日 45 点赞 0 评论 727 浏览

SPAR3D

SPAR3D是一种基于两阶段设计的单图像3D重建工具，能从单张2D图像生成高质量的3D网格。它结合点扩散模型与三平面Transformer技术，实现快速、精确的几何与纹理重建，并支持用户交互式编辑。适用于增强现实、影视制作、工业设计等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 730 浏览

Hummingbird

Hummingbird-0 是一款基于深度学习的 AI 口型同步工具，支持零样本学习，无需额外训练即可快速生成高质量口型同步视频。它兼容多种格式，支持最长 5 分钟视频处理，1 分钟内生成 10 秒视频，适用于影视制作、广告、本地化翻译及 AI 内容创作等场景。通过多模态融合技术，实现音频与视频的精准匹配，提升内容表现力。

AI项目与工具 2025年06月11日 42 点赞 0 评论 732 浏览

文心大模型X1

文心大模型X1是百度开发的深度思考型AI模型，具备中文知识问答、逻辑推理、文学创作等能力，支持多模态内容生成与工具调用。采用递进式强化学习与端到端训练技术，结合飞桨平台实现高效推理。适用于文学创作、文案生成、学术研究、代码开发等多个领域，提供高性价比的AI服务。

AI项目与工具 2025年06月12日 64 点赞 0 评论 737 浏览

Fish Agent

Fish Agent是一款集成了自动语音识别（ASR）与文本到语音（TTS）技术的端到端语音处理工具，能够直接实现语音到语音的转换，无需传统语义编码器/解码器。它支持多种语言，适用于语音转换、环境音频信息捕捉等场景，并基于深度学习技术优化了语音处理性能。Fish Agent可广泛应用于内容创作、教育、客户服务及娱乐等领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 740 浏览

Bocha Semantic Reranker

Bocha Semantic Reranker是一款基于语义的排序模型，用于提升搜索和问答系统的准确性。它通过二次优化初步排序结果，评估查询与文档的语义相关性，并为文档分配语义得分。该工具支持多种语言模型，适用于搜索引擎优化、问答系统、推荐系统和智能客服等领域，旨在改善用户体验并提高系统效率。

AI项目与工具 2025年06月12日 15 点赞 0 评论 740 浏览

Finedefics

Finedefics是由北京大学彭宇新教授团队开发的细粒度多模态大模型，专注于提升多模态大语言模型在细粒度视觉识别任务中的表现。该模型通过引入对象的细粒度属性描述，结合对比学习方法，实现视觉对象与类别名称的精准对齐。在多个权威数据集上表现出色，准确率达76.84%。其应用场景涵盖生物多样性监测、智能交通、零售管理及工业检测等领域。

AI项目与工具 2025年06月12日 10 点赞 0 评论 740 浏览

Sonic

Sonic是由腾讯与浙江大学联合开发的音频驱动肖像动画框架，基于音频信号生成逼真面部表情和动作。它通过上下文增强音频学习和运动解耦控制器，提升唇部同步精度与运动多样性。Sonic在长视频生成中表现出色，具备高稳定性与自然连贯性，支持用户自定义参数。适用于虚拟现实、影视制作、在线教育、游戏开发和社交媒体等多个领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 741 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期