数据集 - 智狐AI导航

Time

Time-MoE是一种基于混合专家架构的时间序列预测模型，通过稀疏激活机制提高计算效率并降低成本。该模型支持任意长度的输入和输出，能够在多个领域实现高精度的时序预测。经过大规模数据集Time-300B的预训练，Time-MoE展现出卓越的泛化能力和多任务适应性，广泛应用于能源管理、金融预测、电商销量分析、气象预报以及交通规划等领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 722 浏览

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架，通过生成高质量事故视频并结合自然语言描述与推理，提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强，支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT，AVD2在多项评估中表现优异，为自动驾驶安全提供了重要技术支撑。

AI项目与工具 2025年06月12日 62 点赞 0 评论 722 浏览

FineWeb 2

FineWeb 2是一个涵盖超过1000种语言的多语言预训练数据集，通过语言识别、去重、内容过滤及PII匿名化处理生成。它支持多种NLP任务，如机器翻译和文本分类，旨在增强多语言模型的性能与普适性，并为研究者提供技术验证的工具与资源。

AI项目与工具 2025年06月12日 16 点赞 0 评论 727 浏览

AgiBot World是一个由智元机器人开发的百万真机数据集，专注于具身智能技术的研究。它涵盖了80多种日常生活技能，涉及家居、餐饮、工业、商超及办公五大场景，数据规模和质量均领先于谷歌的Open X-Embodiment。数据采集利用了智元自建的工厂和实验基地，通过8个摄像头和6自由度灵巧手等先进硬件，确保了全域真实场景下的高质量数据获取。项目还计划开源仿真数据、发布具身基座大模型及配套工具链

AI项目与工具 2025年06月12日 10 点赞 0 评论 733 浏览

Powerdrill.ai

一款专为连接数据和人工智能而构建的工具。Powerdrill.ai提供无代码、一站式集成您的数据和 OpenAI 大语言模型（LLMs）的服务和平台，以实现智能问答和生态系统交互。

数据分析 2025年06月05日 36 点赞 0 评论 740 浏览

九章大模型(MathGPT)

学而思九章大模型是好未来自主研发的，面向全球数学爱好者和科研机构，以解题和讲题算法为核心的大模型。

创作工具 1970年01月01日 0 点赞 0 评论 741 浏览

K2

地球科学的开源大预言模型，首先在收集和清理过的地球科学文献（包括地球科学开放存取论文和维基百科页面）上对 LLaMA 进行进一步预训练，然后使用知识密集型指令调整数据（GeoSig...

Ai平台模型 1970年01月01日 0 点赞 0 评论 743 浏览

MaskGCT

MaskGCT是一款基于掩码生成模型与语音表征解耦编码技术的语音合成大模型，由趣丸科技与香港中文大学（深圳）联合开发。其主要功能包括声音克隆、跨语种语音合成、语音控制及高质量语音数据集支持。该模型在多个TTS基准数据集上表现优异，可快速精准地克隆音色并灵活调整语音属性，适用于多种语言，已开源并面向全球用户开放。

AI项目与工具 2025年06月12日 35 点赞 0 评论 744 浏览

DNA-RENDERING数字人库

DNA-Rendering是一个具有高多样性和高保真度的神经演员渲染库，它为广泛的研究任务提供了丰富的数据和高质量的注释。

Ai视频生成 1970年01月01日 0 点赞 0 评论 746 浏览

CCI 3.0

CCI 3.0是一项由智源研究院开发的大规模中文互联网语料库，包含1000GB主数据集及498GB高质量子集。该语料库覆盖新闻、社交媒体、博客等领域，数据规模较前代扩大近一倍，来源增至20余家机构。通过多维度标注与数据清洗技术，CCI 3.0筛选出高价值数据，适用于自然语言处理、大模型训练、知识图谱构建、内容推荐系统以及教育科研等多种应用场景。

AI项目与工具 2025年06月12日 16 点赞 0 评论 751 浏览

数据集

首页

数据集

列表

默认

浏览次数

发布日期