微信扫码
添加专属顾问
我要投稿
今天是2024年9月11日,星期三,北京,天气阴
我们来看两个工作,一个是PdfTable工具包:深度学习在表格提取中的统一应用,另一个是大模型偏好学习综述。
这两个方案都很有趣,对于理解一些技术细节,供大家一起参考并思考。
《PdfTable: A Unified Toolkit for Deep Learning-Based Table Extraction 》(https://arxiv.org/pdf/2409.05125,代码:https://github.com/CycloneBoy/pdf_table,注注意,代码仓库还是空的)介绍了一个名为PdfTable的统一工具包,用于从PDF文件和图像中提取表格信息。
该工具包集成了多个开源模型,能够适应不同的应用场景,如处理有线表格、无线表格、数字PDF和图像PDF等。
1、 PdfTable库的设计和实现
PdfTable 由四个主要模块组成,包括布局分析、表格结构识别、文本检测与识别以及应用模块。
处理流程包括输入预处理、布局分析、表格结构识别、文本提取和应用。
2、表格解析流水线(PdfTable Parse Pipeline)
输入预处理(Input Preprocessing):
布局分析(Layout Analysis):
表格结构识别(Table Structure Recognition):
文本检测与识别(Text Detection and Recognition):
表格内容提取(Table Content Extraction):
应用(Application):
关于大模型偏好学习综述,《Towards a Unified View of Preference Learning for Large Language Models: A Survey》:https://arxiv.org/html/2409.02795v3,提供了对大型语言模型(LLM)偏好学习领域的全面概述,该供工作提出了一个统一的框架,将偏好学习策略分解为四个组成部分:模型、数据、反馈和算法。这个框架有助于深入理解现有的对齐算法,并揭示了不同策略之间的联系。
其中,在数据方面,讨论了如何收集偏好数据,包括在线(on-policy)和离线(off-policy)数据收集方法,以及这些数据如何从人类或LLM生成。
在算法方面,介绍了多种算法,包括点式(point-wise)、成对(pair-wise)、列表式(list-wise)方法,以及无需训练的对齐方法。这些算法通过不同的方式利用数据和反馈来优化LLM。
在评估方面,讨论了如何评估LLM的偏好学习,包括基于规则的评估和基于LLM的评估方法,以及这些方法的局限性。
可以重点看看一下几个图:
1、大模型偏好学习的组成
Figure 1 提供了一个关于大型语言模型(LLM)偏好学习统一视角的图示性说明。
2、大模型(LLM)偏好学习分类框架
Figure 2 提供了大型语言模型(LLM)偏好学习的一个分类框架,展示了不同组件和方法如何组合在一起。
3、偏好学习的示例
4、点式损失的偏好学习策略示例
5、偏好学习概览
要使大型语言模型(LLM)πθ与人类偏好对齐,首先需要准备偏好数据。与人类偏好对齐的环境会向偏好数据提供反馈。需要注意的是,这些反馈可以是人类标注的标签或偏好,或者是奖励模型输出的标量值。通过将模型、数据和反馈输入到特定算法中,我们获得了一个与人类偏好对齐的LLM πθ'。
6、偏好学习中模型获得的奖励说明
对于一个数据样本 (?, ?ˆ),其中 ?ˆ 是未标记的候选输出,奖励函数应该提供反馈,这可以是奖励分数 ? 或偏好标签。根据是否需要训练特定的奖励模型,奖励函数可以分为直接反馈和基于模型的反馈。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-10
1次搭建完胜1亿次编码,MCP硅谷疯传!Anthropic协议解锁智能体「万能手」
2025-03-10
AI代理技术发展趋势与挑战
2025-03-10
有关智能体/Agent,和上下文协议/MCP的一些概念,以及为什么它重要
2025-03-10
通俗讲解DeepSeek中的GRPO:强化学习里的神奇算法
2025-03-10
AI智能体新秀 Manus失手泄底牌:Claude Sonnet沙盒代码大曝光!
2025-03-10
告别Agentic工作流?推理模型+行动链学习=Agent模型
2025-03-10
MCP (Model Context Protocol),一篇就够了。
2025-03-10
大模型时代,为什么模型都是多少B?
2024-08-13
2024-06-13
2024-09-23
2024-08-21
2024-05-28
2024-07-31
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-03-10
2025-03-10
2025-03-08
2025-03-08
2025-03-07
2025-03-07
2025-03-05
2025-03-05