微信扫码
与创始人交个朋友
我要投稿
在知识库中,无论是文本知识库、表格知识库还是专门的图片知识库都可以上传图片,我们需要通过一些实验尝试他们之间有什么不同,该在什么场景下使用哪种方案。
测试图片在文本知识库中的效果。测试图片在表格知识库中的效果。测试图片在图片知识库中的效果。
在文本类型知识库中插入图片。
思考:知识库chunk的分割方案有两种(按知识点分割和按token数分割),图片在每个chunk中没有特殊标识,所以插入位置和分割方案都会对其产生影响。
在上方插入了三张图片
在下方插入了三张图片
上面一张,下面两张
将使用与上面相同的方法尝试是否能够显示图片。由于测试方法类似就不在展示测试过程,直接给出测试结果。
给表格添加一个列,类型使用image类型。上传数据,它存储的是一个URL。
照片(图片)知识库,创建后,只需要上传图片数据即可。知识库会对图片进行处理,处理的方式就是识图,并将图片中出现的元素用文字描述出来。例如:识图生成的描述信息可以修改,并且可以重新生成。不过,识图的结果通常也就是对图片的一个简单的描述。在图片知识库下,图片和图片的描述的关系更加紧密和直接,且这个知识库的主体就是图片,而描述则是作为查询的载体出现。
例如:
图片是知识库的一部分,作为知识点的一部分内容显示,默认情况下返回知识点的时候会显示这些图片,即使没有明确的表明要显示图片。(因为本质上是找到对应的chunk作为上下文,然后通过大模型输入,所以可以通过prompt控制显示和不显示图片)。
一些介绍性的信息,比如查询某种动物时,里面可以插入图片,作为动物知识点的一部分,用户在查询时就能一起返回。或者作为操作手册,不只返回操作步骤,同时返回该操作步骤的操作图片。
图片是列表的一个属性,在查询表格信息的时候,查询要求没有明确的要求时,通常是不会返回图片。这个图片就是对应这一行。可以有多列,可以有多种图片。图片和本行的其他信息并没有很紧抿的联系,他们的关系就是他们都属于同一行。
作为一些辅助信息来使用,例如,商品图片,户型图等
可以作为一列被查询出来。不过图片本身并不能作为查询条件被体现,通常只能作为表现信息的手段。
知识的主体时图片,文字是对这个图片的描述,或者说你希望查询图片时需要用到的词语。这个知识库的类型就是用来保存和查询图片。你可以对图片进行丰富的描述,以便在实际应用场景中
查找某些类似的图片,比如查询相似场景的图片。给文章配图,根据文章的内容生成对图片的要求,然后匹配图片。
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-22
技术动态 | 如何使用知识图谱改进RAG?
2024-11-22
RAG前沿之RAG–知识图谱构建框架Graphusion:兼看LongRAG双视角检索增强生成范式
2024-11-21
OpenSPG/KAG 新版发布:聚焦用户反馈,大幅优化用户体验!
2024-11-15
大语言模型与图结构的融合:推荐系统中的新兴范式
2024-11-15
利用LLM构建非结构化文本的知识图谱
2024-11-13
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
2024-11-13
利用LLM Graph Transformer实现知识图谱的高效构建
2024-11-12
什么是知识图谱和AI多模态推理
2024-07-17
2024-07-11
2024-07-13
2024-08-13
2024-07-08
2024-07-12
2024-07-26
2024-06-10
2024-07-04
2024-06-24
2024-11-22
2024-11-04
2024-10-10
2024-10-03
2024-09-27
2024-09-08
2024-09-05
2024-08-27