数据集 - 智狐AI导航

SeniorTalk

SeniorTalk是全球首个面向中文超高龄老年人的语音数据集，涵盖202位75岁以上老人的55.53小时语音数据，覆盖16个省市，包含多种口音。数据通过两两自发对话采集，内容贴近真实交流场景，并附有多维标注，如说话人信息、时间戳、口音分类等。该数据集可用于语音识别、说话人验证、语音编辑等研究，支持适老化设备、健康管理和辅助养老系统的开发，推动相关技术进步。

AI项目与工具 2025年06月12日 71 点赞 0 评论 690 浏览

Emotion

Emotion-LLaMA是一款基于多模态输入的情绪识别与推理模型，结合音频、视觉和文本信息，提升情感理解的准确性与可解释性。模型采用改进版LLaMA架构，通过指令调整增强情感处理能力，并依托自建的MERR数据集进行训练与验证。在多个挑战赛中表现优异，适用于人机交互、教育、心理健康、客户服务等领域，具有广泛的应用前景。

AI项目与工具 2025年06月12日 85 点赞 0 评论 690 浏览

Infinity

Infinity-MM是智源研究院发布的千万级多模态指令数据集，包含4300万条样本，涵盖视觉问答、文字识别、文档分析及数学推理等多领域任务。它通过严格的筛选和去重保证数据质量，并采用合成数据生成技术扩展数据集规模。基于此数据集，智源研究院训练出了20亿参数的Aquila-VL-2B模型，在多项基准测试中表现出色，推动了多模态AI领域的研究与发展。

AI项目与工具 2025年06月12日 87 点赞 0 评论 690 浏览

ID

ID-Animator是一款由腾讯光子工作室、中科大和中科院合肥物质科学研究院联合开发的零样本人类视频生成技术。它能够根据单张参考面部图像生成个性化视频，并根据文本提示调整视频内容。ID-Animator通过结合预训练的文本到视频扩散模型和轻量级面部适配器，实现高效的身份保真视频生成。其主要功能包括视频角色修改、年龄和性别调整、身份混合以及与ControlNet等现有条件模块的兼容性。

AI项目与工具 2024年01月01日 67 点赞 0 评论 691 浏览

OmniAlign

OmniAlign-V是由多所高校联合开发的多模态大语言模型对齐数据集，包含约20万个多模态样本，涵盖自然图像和信息图表。其核心功能包括提供高质量训练数据、提升模型的开放式问答能力、增强推理与创造力，并支持模型持续优化。数据集通过图像筛选、任务设计及后处理优化确保数据质量，适用于多模态对话系统、图像辅助问答、创意生成等多个应用场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 691 浏览

MMRole是一个由中国人民大学高瓴人工智能学院研究团队开发的多模态角色扮演智能体（MRPA）框架。该框架通过整合图像和文本，使智能体能够以特定角色进行更为自然和沉浸式的对话。MMRole框架包括一个大规模、高质量的多模态数据集和一个全面的评估方法，用于开发和评估MRPAs的性能。该框架为创建能够理解和生成与图像相关对话内容的智能体提供了新的可能，并扩展了其在教育、娱乐、客户服务、社交模拟和内容创

AI项目与工具 2025年06月12日 28 点赞 0 评论 693 浏览

Objaverse-3D物体数据集

Objaverse 是一个为3D领域提供巨大资源的数据库，它不仅支持 AI 模型的训练和3D内容的生成，还与流行的3D编辑软件 Blender 兼容。

Ai绘画生成 2026年06月30日 0 点赞 0 评论 699 浏览

LongWriter

LongWriter是一款由清华大学与智谱AI合作开发的长文本生成模型，能够生成超过10,000字的连贯文本。该模型基于增强的长上下文大型语言模型，采用了直接偏好优化（DPO）技术和AgentWrite方法，能够处理超过100,000个token的历史记录。LongWriter适用于多种应用场景，包括学术研究、内容创作、出版行业、教育领域和新闻媒体等。

AI项目与工具 2025年06月12日 67 点赞 0 评论 714 浏览

Animagine XL 3.1

一个开源的文本生成图像动漫模型，通过整合新的数据集，Animagine XL 3.1扩展了对广泛动漫作品和风格的理解，从经典作品到最新发布的动漫，覆盖了从古老到现代的各种艺术风格。

Ai开源项目 2025年06月05日 10 点赞 0 评论 715 浏览

GTSinger

GTSinger是一项由浙江大学研发的开源高质量歌声数据集，包含80.59小时的多语言专业录音棚歌声数据，支持歌声合成、技巧识别、风格迁移和语音到歌声转换等多种任务。它通过音素级标注和真实乐谱支持，为歌唱技巧的研究和应用提供了强大工具。

AI项目与工具 2025年06月12日 77 点赞 0 评论 717 浏览

数据集

首页

数据集

列表

默认

浏览次数

发布日期