中文

微软亚洲研究院

微软亚洲研究院是微软公司在海外开设的第二家基础科研机构,也是亚洲地区仅有的两个基础研究机构之一(另一个是微软印度研究院)。微软亚洲研究院是微软公司在亚太地区设立的基础...

BAAI北京智源人工智能研究院

北京智源人工智能研究院(简称:智源研究院 Beijing Academy of Artificial Intelligence,BAAI)是人工智能领域的新型研发机构。2018年11月14日,在科技部和北京市支持下,联合北...

网易·伏羲

网易伏羲是网易旗下专业从事游戏与泛娱乐AI研究和应用的顶尖机构。专注于数字孪生、强化学习、用户画像、自然语言处理、分布式引擎等多个领域的技术创新,提供“瑶台”沉浸式虚拟活...

CCI 3.0

CCI 3.0是一项由智源研究院开发的大规模中文互联网语料库,包含1000GB主数据集及498GB高质量子集。该语料库覆盖新闻、社交媒体、博客等领域,数据规模较前代扩大近一倍,来源增至20余家机构。通过多维度标注与数据清洗技术,CCI 3.0筛选出高价值数据,适用于自然语言处理、大模型训练、知识图谱构建、内容推荐系统以及教育科研等多种应用场景。

CDial

CDial-GPT是一项由清华大学研发的基于大型中文对话数据集LCCC的预训练对话生成模型。该模型提供LCCC-base和LCCC-large两个版本的数据集,并具备预训练、微调、多模态学习等功能,能够生成高质量的对话回应。其应用场景涵盖客户服务、智能助手、在线教育等多个领域。