数据集 - 智狐AI导航

smoltalk

Smoltalk-Chinese 是 OpenCSG 开发的中文大型语言模型专用合成数据集，包含 70 多万条高质量数据，涵盖多种任务类型，如信息查询、编程、数学、创意写作等。数据通过先进模型生成并经过严格筛选和去重，确保多样性与质量，适用于模型微调和多场景应用，提升语言理解和生成能力。

AI项目与工具 2025年06月12日 41 点赞 0 评论 548 浏览

OmniBooth

OmniBooth是一款由华为诺亚方舟实验室与香港科技大学联合开发的图像生成框架，支持基于文本或图像的多模态指令控制及实例级定制。它通过高维潜在控制信号实现对图像中对象位置和属性的精准操控，具备多模态嵌入提取、空间变形技术以及特征对齐网络等功能，广泛应用于数据集生成、内容创作、游戏开发、虚拟现实及广告营销等领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 555 浏览

xGen

xGen-MM是一款由Salesforce开发的开源多模态AI模型，具备处理文本和图像等数据类型的能力。该模型通过学习大量图像和文字信息，在视觉语言任务中表现出色，并通过开源模型、数据集和微调代码库促进模型性能的提升。xGen-MM具有多模态理解、大规模数据学习、高性能生成、开源可访问和微调能力等特点。其应用场景广泛，包括图像描述生成、视觉问答、文档理解、内容创作和信息检索等。

AI项目与工具 2025年06月12日 57 点赞 0 评论 557 浏览

TimeSuite是一种由上海AI Lab开发的框架，专注于提升多模态大型语言模型在长视频理解任务中的表现。它通过引入高效的长视频处理框架、高质量的视频数据集TimePro和Temporal Grounded Caption任务，提升了模型对视频内容的时间感知能力，减少了幻觉风险，并显著提高了长视频问答和时间定位任务的性能。其核心技术包括视频令牌压缩、时间自适应位置编码、U-Net结构及多样化任务

AI项目与工具 2025年06月12日 78 点赞 0 评论 560 浏览

LongVILA

LongVILA是一款专为长视频理解设计的视觉语言AI模型，由多家知名研究机构共同开发。它具备强大的长上下文处理能力和多模态序列并行性，能在大量GPU上高效训练，无需梯度检查点。LongVILA通过五阶段训练流程，结合大规模数据集构建和高性能推理，显著提升了长视频字幕的准确性和处理效率。此外，它还支持多种应用场景，包括视频字幕生成、内容分析、视频问答系统等。

AI项目与工具 2025年06月12日 52 点赞 0 评论 560 浏览

AGUVIS

AGUVIS是一款由香港大学与Salesforce联合开发的纯视觉框架，专为自主GUI智能体设计。它支持跨平台操作，通过图像观察与自然语言指令的关联，以及显式规划和推理能力，提高了代理在复杂数字环境中的交互效率。AGUVIS采用大规模数据集及两阶段训练方法，实现了在离线与在线场景中的高效性能，成为首个不依赖外部闭源模型即可独立完成任务的纯视觉GUI代理。

AI项目与工具 2025年06月12日 97 点赞 0 评论 561 浏览

PandaAI

PandaAI 是一款基于自然语言处理技术的智能数据分析平台，支持用户通过自然语言提问实现快速数据处理与可视化。它具备多数据源集成、智能图表生成、团队协作等功能，适用于商业分析、数据科学及数据管理等场景。平台提供免费与付费版本，满足不同用户需求，结合 LLM 与 RAG 技术提升数据分析效率。

AI项目与工具 2025年06月12日 65 点赞 0 评论 566 浏览

GameFactory

GameFactory 是由香港大学与快手科技联合研发的AI框架，专注于解决游戏视频生成中的场景泛化问题。它基于预训练视频扩散模型，结合开放域数据与高质量游戏数据，通过多阶段训练实现动作可控的多样化场景生成。具备高精度动作控制、交互式视频生成及丰富场景支持，适用于游戏开发、自动驾驶模拟及具身智能研究等领域。

AI项目与工具 2025年06月12日 31 点赞 0 评论 566 浏览

Rose AI

Rose AI是一个旨在帮助用户查找、参与、可视化和共享数据的云数据平台。

数据分析 2025年06月05日 65 点赞 0 评论 573 浏览

InfiMM

InfiMM-WebMath-40B是由字节跳动与中国科学院联合推出的大规模多模态数据集，涵盖大量数学和科学内容，包括文本、公式、符号及图像。该数据集通过筛选、清洗和标注优化，可显著提升多模态模型的数学推理能力。它适用于数学题库生成、学习工具开发、论文理解及科学研究等多个应用场景。 ---

AI项目与工具 2025年06月12日 100 点赞 0 评论 573 浏览

数据集

首页

数据集

列表

默认

浏览次数

发布日期