端到端 - 智狐AI导航

Nvidia·GET3D

我们通过两个潜在代码生成 3D SDF 和纹理场。我们利用 DMTet 从 SDF 中提取 3D 表面网格，并查询表面点处的纹理场以获取颜色。我们使用在 2D 图像上定义的对抗损失进行训练。

创作工具 2026年06月27日 0 点赞 0 评论 536 浏览

第四范式4Paradigm

企业级人工智能领域的行业先驱者与领导者

创作工具 2026年06月27日 0 点赞 0 评论 461 浏览

运小沓Cuber

运小沓Cuber作为全球供应链超自动化平台，通过其创新的技术和解决方案，帮助企业实现数字化转型，提升运营效率，降低成本，并在竞争激烈的市场中保持领先。

创作工具 2026年06月27日 0 点赞 0 评论 520 浏览

Atlas

Atlas是一个利用人工智能技术创建3D内容的平台，它允许用户通过参考图像和文本轻松生成高度详细且多样化的3D模型。

Ai绘画生成 2026年06月27日 0 点赞 0 评论 344 浏览

MGIE

MGIE 是苹果团队开源的一款 AI 图像编辑工具，它利用多模态大模型来增强图像编辑的指令引导能力。用户只需拍摄照片并输入文字指令，MGIE 便能够自动进行图像编辑，实现用户所需的...

Ai绘画生成 2026年06月27日 0 点赞 0 评论 348 浏览

abab

一个强大的AI音乐生成工具，它通过先进的技术，使得音乐创作更加便捷和高效。无论是专业的音乐制作人还是业余爱好者，都能够利用这个模型来创作出高质量的音乐作品。

Ai平台模型 2026年06月27日 0 点赞 0 评论 324 浏览

OmniGen

创新的统一图像生成模型，它通过简化架构和整合多种图像生成任务，为用户提供了一个强大而灵活的工具。它不仅能够处理文本到图像的生成，还能够执行图像编辑、主题驱动生成和视觉...

Ai平台模型 2026年06月27日 0 点赞 0 评论 387 浏览

MooER

MooER是一款基于国产全功能GPU训练的开源音频理解大模型，由摩尔线程推出。它能够进行中文和英文的语音识别，并具备中译英的语音翻译能力。MooER在Covost2中译英测试集中取得25.2的BLEU分数，接近工业级标准。其主要功能包括语音识别、语音翻译、高效率训练以及开源模型。该模型采用深度学习架构和端到端训练模式，具有强大的多语言处理能力和广泛的适用性。

AI项目与工具 2025年06月12日 41 点赞 0 评论 963 浏览

Lingo

Lingo是一款由西湖心辰开发的国内首个端到端语音大模型，具备实时交互、语音理解、多风格语音表达、情绪价值等功能。Lingo在人机对话的自然流畅度和情绪感知方面表现出色，适用于智能家居、客户服务、教育、医疗等多个领域。其核心技术包括端到端设计、深度学习算法和自然语言处理，旨在提供高质量的语音交互体验。

AI项目与工具 2025年06月12日 22 点赞 0 评论 961 浏览

PGTFormer是一款先进的视频人脸修复框架，通过解析引导的时间一致性变换器恢复视频中的高保真细节，同时增强时间连贯性。该方法无需预对齐，通过语义解析选择最佳人脸先验，并结合时空Transformer模块和时序保真度调节器，实现了高效且自然的修复效果。其主要功能包括盲视频人脸修复、语义解析引导、时间一致性增强、时空特征提取、端到端修复和时序保真度调节。PGTFormer适用于电影和视频制作、视频

AI项目与工具 2025年06月12日 90 点赞 0 评论 867 浏览

端到端

首页

端到端

列表

默认

浏览次数

发布日期