LongCite是清华大学开发的一个项目,旨在提高大型语言模型(LLMs)在处理长文本问答任务时的可信度和可验证性。该项目通过生成细粒度的句子级引用,使用户能够验证模型的回答是否准确。LongCite的核心组成部分包括LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集,以及基于该数据集训练的LongCite-8B和LongCite-9B模型。这些模型能够理解和处理长文本内容,并提供准确的问答服务,同时附带可追溯至原文的引用,从而增强信息的透明度和可靠性。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部