我要投稿

清华开源LongCite，如何提高大模型的溯源能力？

发布日期：2024-09-07 10:03:27 浏览次数： 3006

作者：NLP前沿

微信搜一搜，关注“NLP前沿”

溯源/引用，工业界应用老板们最喜欢加的一个东西。总的来说，这个文章也没啥。做了一个评测基准，开源了一个用于溯源sft的45k数据集，开源了2个模型，介绍了他们的数据生成pipeline。

hf-dataset:https://huggingface.co/datasets/THUDM/LongCite-45k
model 1:https://huggingface.co/THUDM/LongCite-glm4-9b
model 2:https://huggingface.co/THUDM/LongCite-llama3.1-8b
github: https://github.com/THUDM/LongCite

主要看看数据生成的pipeline把，如下图：3步+1步过滤（为啥不一步到位了，说是这样更干净，先出答案，在生成引用）

QA数据生成：LLM生成与给定长文本相关的查询和答案。
块级引用生成：给chunk标上引用，结合问题，答案，生成带引用的chunk级别qa数据
句子级引用提取：从每个chunk引用中提取出支持每个陈述的相关句子，生成细粒度引用。
过滤，丢弃引用数量不足的样本。

数据比例，中文占比比较多。可以比较好的利用私有场景~

整体就是效果更好

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-03-23

128K Star 的开源 AI 编程 Agent，把 Anthropic 逼到发律师函了

2026-03-23

字节跳动开源 DeerFlow 2.0：下一代超级 Agent 引擎，一键搞定复杂工作流！

2026-03-23

企业中职能部门打工人如何选小龙虾

2026-03-23

MiniMax开源技能包：让AI写代码从大学生变资深工程师

2026-03-22

OxyGent：构建高效能多智能体系统的协作框架

2026-03-22

Ollama绝赞适配World Monitor：无需API密钥的全球情报看板，金融地缘一手掌握！`

2026-03-22

重磅！VS Code 正式“改名”！绿色版 VS Code 更强！

2026-03-21

Hugging Face：AI 界的 GitHub 与开源协作的终极生态杠杆

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Clawdbot 完整安装教学：2026 年最火的开源AI 个人助理

2026-01-27

重磅开源！Kimi K2.5 本地部署全攻略：手把手教你跑通 1T MoE 巨兽

2026-01-30

SkillsMP：一个聚合了 5 万+ AI Agent 技能的开源社区

2026-01-12

Clawdbot 深度拆解： 7 个问题看懂它。

2026-01-29

实测Kimi K2.5，这是一款厌丑的开源模型

2026-01-27

ClawdBot 火爆全网，手把手教你如何部署，还能直接用钉钉操作！

2026-01-28

OpenWork：Claude Cowork 的开源替代品

2026-01-21

Claude Code最强开源对手！GitHub 50.2k Star了，作者为它烧掉2.4w美元。

2026-01-06

Clawdbot爆火：Karpathy点赞的开源AI助理，到底是什么？

2026-01-26

为什么你一定要用OpenCode

2026-01-23

大家都在问

英伟达的NemoClaw，能帮AI代理这匹“野马”套上缰绳吗？

2026-03-17

你的 AI Agent 真的在受控运行吗？

2026-03-13

137K 行代码、零 clippy 警告：这个开源项目凭什么让 AI Agent 领域炸锅？

2026-03-02

Clawdbot 如何实现像人一样的长期记忆？

2026-02-05

一夜爆火，Clawdbot是否才是真正的AI入口产品？

2026-01-28

Clawdbot爆火：Karpathy点赞的开源AI助理，到底是什么？

2026-01-26

速递 | DeepSeek突然扔出MODEL1，这到底是V4还是R2？

2026-01-21

DeepSeek-R2要来了？

2026-01-21

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部