微信扫码
与创始人交个朋友
我要投稿
信息提取(IE)旨在从非结构化文本中提取结构化信息。关系抽取作为IE的一个子领域,目的是识别出实体(S和O)之间特定的关系(P)。现有的基于神经学习的方法在精确度上表现良好,但存在召回率(即识别出所有相关实体的能力)有限的问题。此外,这些方法大多只能处理单个段落,而无法从长篇文本中提取信息。因此,提出了从长文本(如整本书或多个网页)中提取与特定主题相关的长对象列表的问题。
通过在新构建的数据集上进行实验,该数据集包含10本书籍和8种关系类型
L3X方法在召回率和R@P指标上显著优于仅使用LLM生成的方法。L3X方法能够有效地从长文本中提取长对象列表,并且通过不同的提示、段落排名和批处理技术,可以进一步提高性能。
Recall Them All: Retrieval-Augmented Language Models for Long Object List Extraction from Long Documentshttps://arxiv.org/pdf/2405.02732
推荐阅读
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-03-30
2024-04-26
2024-05-10
2024-04-12
2024-05-28
2024-05-14
2024-04-25
2024-07-18
2024-04-26
2024-05-06
2024-12-22
2024-12-21
2024-12-21
2024-12-21
2024-12-21
2024-12-20
2024-12-20
2024-12-19