数据集 - 智狐AI导航

OmniCorpus

OmniCorpus是上海人工智能实验室联合多家知名高校和研究机构共同创建的一个大规模多模态数据集，包含86亿张图像和16960亿个文本标记，支持中英双语。它通过整合来自网站和视频平台的文本和视觉内容，提供了丰富的数据多样性。OmniCorpus不仅规模庞大，而且数据质量高，适合多模态机器学习模型的训练和研究。它广泛应用于图像识别、视觉问答、图像描述生成和内容推荐系统等领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 608 浏览

CogView

CogView-3-Plus是智谱AI研发的AI文生图模型，采用Transformer架构替代传统的UNet，优化了扩散模型中的噪声规划。它能够根据用户指令生成高质量、高美学评分的图像，支持多种分辨率，并具有实时生成图像的能力。该模型已被集成到“智谱清言”APP中，并提供API服务，适用于艺术创作、游戏设计、广告制作等多个图像生成领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 607 浏览

MaskGCT

MaskGCT是一款基于掩码生成模型与语音表征解耦编码技术的语音合成大模型，由趣丸科技与香港中文大学（深圳）联合开发。其主要功能包括声音克隆、跨语种语音合成、语音控制及高质量语音数据集支持。该模型在多个TTS基准数据集上表现优异，可快速精准地克隆音色并灵活调整语音属性，适用于多种语言，已开源并面向全球用户开放。

AI项目与工具 2025年06月12日 35 点赞 0 评论 603 浏览

FineWeb 2

FineWeb 2是一个涵盖超过1000种语言的多语言预训练数据集，通过语言识别、去重、内容过滤及PII匿名化处理生成。它支持多种NLP任务，如机器翻译和文本分类，旨在增强多语言模型的性能与普适性，并为研究者提供技术验证的工具与资源。

AI项目与工具 2025年06月12日 16 点赞 0 评论 603 浏览

Time

Time-MoE是一种基于混合专家架构的时间序列预测模型，通过稀疏激活机制提高计算效率并降低成本。该模型支持任意长度的输入和输出，能够在多个领域实现高精度的时序预测。经过大规模数据集Time-300B的预训练，Time-MoE展现出卓越的泛化能力和多任务适应性，广泛应用于能源管理、金融预测、电商销量分析、气象预报以及交通规划等领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 593 浏览

AgiBot World是一个由智元机器人开发的百万真机数据集，专注于具身智能技术的研究。它涵盖了80多种日常生活技能，涉及家居、餐饮、工业、商超及办公五大场景，数据规模和质量均领先于谷歌的Open X-Embodiment。数据采集利用了智元自建的工厂和实验基地，通过8个摄像头和6自由度灵巧手等先进硬件，确保了全域真实场景下的高质量数据获取。项目还计划开源仿真数据、发布具身基座大模型及配套工具链

AI项目与工具 2025年06月12日 10 点赞 0 评论 592 浏览

CCI 3.0

CCI 3.0是一项由智源研究院开发的大规模中文互联网语料库，包含1000GB主数据集及498GB高质量子集。该语料库覆盖新闻、社交媒体、博客等领域，数据规模较前代扩大近一倍，来源增至20余家机构。通过多维度标注与数据清洗技术，CCI 3.0筛选出高价值数据，适用于自然语言处理、大模型训练、知识图谱构建、内容推荐系统以及教育科研等多种应用场景。

AI项目与工具 2025年06月12日 16 点赞 0 评论 577 浏览

ShowUI

ShowUI是一款由新加坡国立大学Show Lab与微软合作开发的视觉-语言-行动模型，旨在提升图形用户界面（GUI）助手的工作效率。该模型通过UI引导的视觉令牌选择、交错视觉-语言-行动流以及高质量数据集的运用，实现了高效的零样本截图定位和GUI自动化功能，广泛应用于网页自动化、移动应用测试、桌面软件自动化及游戏自动化等领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 575 浏览

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架，通过生成高质量事故视频并结合自然语言描述与推理，提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强，支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT，AVD2在多项评估中表现优异，为自动驾驶安全提供了重要技术支撑。

AI项目与工具 2025年06月12日 62 点赞 0 评论 562 浏览

AtomThink

AtomThink是一个由多所高校与企业联合研发的多模态数学推理框架，通过构建长链思维（CoT）引导多模态大型语言模型（MLLMs）进行复杂推理。它包含自动CoT注释引擎、原子步骤微调策略及多种搜索策略，旨在提升原子步骤质量并增强MLLMs的推理能力。AtomThink提出的大规模多模态数据集AtomMATH及其评估方法为模型训练和测试提供了重要支持，广泛应用于教育辅助、自动化测试、学术研究等领域

AI项目与工具 2025年06月12日 62 点赞 0 评论 561 浏览

数据集

首页

数据集

列表

默认

浏览次数

发布日期