微信扫码
与创始人交个朋友
我要投稿
7月5日,上海银行申请的一项名为“大模型驱动的智能知识平台”的专利公布。其申请于2024年4月30日,属于人工智能和大数据技术领域。
据悉,该平台包括数据收集模块、数据处理模块、大模型训练模块、知识图谱生成模块、知识检索模块、用户界面模块、问答处理模块和结果优化模块。
数据收集模块用于从各种来源收集知识数据,包括但不限于书籍、网页、论坛、社交媒体,该模块能够提取大量的知识数据;数据处理模块用于对收集到的知识数据进行清洗、整理和标注,以便于后续的处理和分析;大模型训练模块用于训练大模型,该模型能够理解和处理知识数据,生成知识图谱;知识图谱生成模块用于根据训练好的大模型生成知识图谱,该图谱能够清晰地展示知识的结构和关系;知识检索模块用于根据用户的需求,从知识图谱中检索相关的知识;用户界面模块用于展示知识图谱和检索结果,提供用户友好的操作界面;问答处理模块用于接收用户的问题,通过大模型生成答案,并将答案返回给用户;结果优化模块用于对生成的答案进行优化,包括答案的准确性、完整性、可读性等方面的优化。
更具体的,数据收集模块包括数据来源、数据清洗和数据预处理。数据来源为网络爬虫、API接口、文件导入等,数据清洗步骤为去重、去除噪声、填充缺失值等,数据预处理为数据归一化、特征提取、文本转词等。
数据处理模块包括数据整合、数据挖掘和知识表示。数据整合为将不同来源的数据进行融合,形成统一的知识库,数据挖掘通过自然语言处理技术,提取关键信息和知识点,知识表示将数据转换为机器可理解的向量表示,便于后续处理。
大模型训练模块包括模型选择、模型训练和模型评估。模型选择根据任务需求选择合适的深度学习模型,如Transformer、BERT等,模型训练使用大量标注数据进行模型训练,优化模型参数,模型评估通过交叉验证、准确率、召回率等指标评估模型性能。
知识图谱生成模块包括实体识别、关系抽取和知识图谱构建。实体识别为从文本中提取实体,如人名、地名、机构名等,关系抽取为从文本中抽取实体之间的关系,如作者与作品的关系、地点与事件的关系等,知识图谱构建为将实体和关系组织成知识图谱结构,便于检索和推理。
知识检索模块包括文本检索、结果排序和可视化展示。文本检索根据用户输入的关键词,在知识图谱中进行匹配和搜索,结果排序根据相关性、热度等因素对搜索结果进行排序,可视化展示将搜索结果以图表、列表等形式展示给用户。
用户界面模块包括交互设计、功能实现和个性化定制。交互设计为设计简洁易用的界面,提供友好的操作体验,功能实现为实现各种功能模块,如搜索、推荐、问答等,个性化定制为根据用户喜好和需求进行个性化定制设置。
问答处理模块包括问题解析、知识检索和结果生成。问题解析对用户输入的问题进行分析和理解,提取关键信息,知识检索在知识图谱中查找相关信息,回答用户问题,结果生成将答案以自然语言的形式输出给用户。
优化模块包括结果筛选和结果摘要。结果筛选对搜索结果进行筛选,去除不相关或低质量的内容,结果摘要对搜索结果进行摘要,提炼关键信息。
说明书提到该发明的背景为,随着互联网的飞速发展,大量的信息被不断地产生和传播。在这个信息爆炸的时代,人们对于知识的获取需求也日益增长。然而,传统的知识获取方式存在效率低下、信息不对称等痛点。
在当前的对公客户服务中,知识库面临着一些挑战和问题。首先,信息传递的速度相对较慢,这可能会导致客户在寻求帮助或解决问题时遭遇延误。其次,由于知识库的更新不及时,重复的客户投诉情况频繁出现,这不仅增加了客户的不满,也给服务团队带来了额外的压力。此外,现有的问答系统数量有限,无法满足所有客户的需求。这些问题的存在,使得银行服务质量受到了一定的影响。
再者,知识库中的知识质量参差不齐,有些信息可能已经过时或者不准确,这对于寻求帮助的客户来说无疑是一种困扰。更为严重的是,目前的知识库主要依赖于人工进行整理和维护,这种方式效率低下,且容易出错。大量的人力和时间被投入到了重复性的工作上,而无法将更多的精力投入到提高服务质量和满足客户需求上。因此,需要寻找更有效的方法来改进知识库管理方式,以提高银行的服务质量和客户满意度。
在该发明中,用户能快速获取到所需的知识内容;可以让大模型具有强大的语义理解能力。当用户提出问题时,模型可以通过分析问题的语义,理解用户的意图并给出相应的答案或解决方案。如此,大模型能够更好地满足用户的需求,提供更加准确和个性化的服务。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-12-21
SAC-KG:利用大型语言模型一键构建领域知识图谱 - 中科大&阿里
2024-12-19
北大Chatlaw - 基于知识图谱增强混合专家模型的多智能体法律助手
2024-12-18
Elasticsearch vs 向量数据库:寻找最佳混合检索方案
2024-12-16
轻量高效的知识图谱RAG系统:LightRAG
2024-12-16
5种方法,让文本信息瞬间变成结构化图谱!
2024-12-16
向量数据库到底算不算一种NoSQL数据库?
2024-12-14
大模型能自动创建高质量知识图谱吗?可行性及人机协同机制 - WhyHow.AI
2024-12-12
大模型+知识图谱在工业领域落地的4大场景
2024-07-17
2024-07-11
2024-08-13
2024-07-13
2024-07-12
2024-06-24
2024-07-08
2024-06-10
2024-07-26
2024-07-04
2024-12-16
2024-12-10
2024-12-04
2024-12-01
2024-11-30
2024-11-22
2024-11-04
2024-10-10