数据集 - 智狐AI导航

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型，能够生成1024×1024像素的高分辨率图像，质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块，HART实现了高效的图像生成，并在多个指标上表现出色，包括重构FID、生成FID以及计算效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 513 浏览

3DV

3DV-TON是一种基于扩散模型的视频虚拟试穿框架，由阿里巴巴达摩院、湖畔实验室与浙江大学联合研发。该工具通过生成可动画化的纹理化3D网格作为帧级指导，提升试穿视频的视觉质量和时间一致性。其支持复杂服装图案和多样化人体姿态，提供高分辨率基准数据集HR-VVT，适用于在线购物、时尚设计、影视制作等多个领域。

AI项目与工具 2025年06月11日 60 点赞 0 评论 515 浏览

PromptFix

PromptFix是一款基于扩散模型的开源AI图像修复工具，支持多种图像处理任务，如上色、物体移除、去雾、去模糊等。它通过20步去噪过程精确修复图像缺陷，同时保持图像结构完整性和泛化能力。PromptFix具备高频细节保护、辅助提示适配器、零样本学习能力和大规模数据集构建等特点，适用于个人照片编辑、专业摄影、数字艺术创作、媒体广告及电影制作等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 523 浏览

Chatbond

Chatbond 是一款专为企业设计的 AI 聊天机器人开发平台，支持多语言、个性化定制及多数据源集成，具备自动重新训练功能以保障信息准确性。其应用场景涵盖客户服务、电子商务、教育、人力资源和医疗保健等领域，能够显著提升运营效率和服务质量。

AI项目与工具 2025年06月12日 11 点赞 0 评论 527 浏览

SynCD

SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集，用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像，结合共享注意力机制和3D资产引导，确保对象一致性。该数据集支持无调优模型训练，提升图像质量和身份保持能力，广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 535 浏览

ChildMandarin

ChildMandarin是由智源研究院与南开大学合作开发的3-5岁儿童普通话语音数据集，包含41.25小时高质量语音，覆盖全国22个省市。数据通过家长引导式对话采集，保证自然真实。该数据集支持语音识别、说话人验证和语言研究，适用于儿童语言学习、教育系统、智能玩具和语音助手优化等领域，为儿童语音技术研究提供重要资源。

AI项目与工具 2025年06月12日 28 点赞 0 评论 541 浏览

EvolveDirector

EvolveDirector是一个由阿里巴巴与南洋理工大学合作开发的文本到图像生成框架，通过与高级模型API交互获取数据对，结合预训练的视觉语言模型（VLMs）动态优化训练集，大幅降低数据量和训练成本。该框架支持多模型学习、动态数据集管理及在线训练，显著提升了生成图像的质量和多样性，广泛应用于内容创作、媒体娱乐、广告营销、教育科研等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 555 浏览

Maya

Maya是一款开源多语言多模态模型，基于LLaVA框架开发，支持中文、法语、西班牙语等多种语言，专注于提升低资源语言的AI内容生成能力。它结合图像和文本数据，实现跨模态对齐和指令微调，广泛应用于跨语言内容理解、图像分析、教育和电子商务等领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 563 浏览

WebLI

WebLI-100B是由Google DeepMind推出的超大规模视觉语言数据集，包含1000亿个图像与文本配对数据，是目前最大的视觉语言数据集之一。其设计旨在提升模型对长尾概念、文化多样性和多语言内容的理解能力。数据集通过网络爬取构建，保留了丰富的语言和文化多样性，支持多模态任务如图像分类、图像描述生成和视觉问答，广泛应用于人工智能研究、工程开发及教育领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 566 浏览

Lucidchart

由Lucid Software开发的在线图表制作和可视化工具，支持创建流程图、组织结构图、思维导图、UML、ERD、BPMN等多种图表类型，并提供实时协作功能。

教育学习 2025年06月05日 65 点赞 0 评论 573 浏览

数据集

首页

数据集

列表

默认

浏览次数

发布日期