微信扫码
添加专属顾问
我要投稿
在知识库中,无论是文本知识库、表格知识库还是专门的图片知识库都可以上传图片,我们需要通过一些实验尝试他们之间有什么不同,该在什么场景下使用哪种方案。
测试图片在文本知识库中的效果。测试图片在表格知识库中的效果。测试图片在图片知识库中的效果。
在文本类型知识库中插入图片。
思考:知识库chunk的分割方案有两种(按知识点分割和按token数分割),图片在每个chunk中没有特殊标识,所以插入位置和分割方案都会对其产生影响。
在上方插入了三张图片
在下方插入了三张图片
上面一张,下面两张
将使用与上面相同的方法尝试是否能够显示图片。由于测试方法类似就不在展示测试过程,直接给出测试结果。
给表格添加一个列,类型使用image类型。上传数据,它存储的是一个URL。
照片(图片)知识库,创建后,只需要上传图片数据即可。知识库会对图片进行处理,处理的方式就是识图,并将图片中出现的元素用文字描述出来。例如:识图生成的描述信息可以修改,并且可以重新生成。不过,识图的结果通常也就是对图片的一个简单的描述。在图片知识库下,图片和图片的描述的关系更加紧密和直接,且这个知识库的主体就是图片,而描述则是作为查询的载体出现。
例如:
图片是知识库的一部分,作为知识点的一部分内容显示,默认情况下返回知识点的时候会显示这些图片,即使没有明确的表明要显示图片。(因为本质上是找到对应的chunk作为上下文,然后通过大模型输入,所以可以通过prompt控制显示和不显示图片)。
一些介绍性的信息,比如查询某种动物时,里面可以插入图片,作为动物知识点的一部分,用户在查询时就能一起返回。或者作为操作手册,不只返回操作步骤,同时返回该操作步骤的操作图片。
图片是列表的一个属性,在查询表格信息的时候,查询要求没有明确的要求时,通常是不会返回图片。这个图片就是对应这一行。可以有多列,可以有多种图片。图片和本行的其他信息并没有很紧抿的联系,他们的关系就是他们都属于同一行。
作为一些辅助信息来使用,例如,商品图片,户型图等
可以作为一列被查询出来。不过图片本身并不能作为查询条件被体现,通常只能作为表现信息的手段。
知识的主体时图片,文字是对这个图片的描述,或者说你希望查询图片时需要用到的词语。这个知识库的类型就是用来保存和查询图片。你可以对图片进行丰富的描述,以便在实际应用场景中
查找某些类似的图片,比如查询相似场景的图片。给文章配图,根据文章的内容生成对图片的要求,然后匹配图片。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-05
低成本+高性能+超灵活!Deepseek 671B+Milvus重新定义知识库搭建
2025-03-05
LlamaIndex+Phi-3:知识图谱生成的黄金组合
2025-03-04
一键发布知识图谱:Obsidian 与 Quartz 的高效协作
2025-03-04
构建智能知识库 - 知识获取:Obsidian Web Clipper 的 AI 自动化流程
2025-03-02
大模型时代的知识工程:企业级智能知识库构建与增强指南
2025-03-02
从 0 到 3000 节点: 我用 DeepSeek + NebulaGraph 构建农业知识图谱
2025-02-26
将知识图谱与大模型 (LLM) 协同化:实现语义增强智能的途径
2025-02-23
DeepSeek+dify知识库,查询数据库的两种方式(api+直连)
2025-01-02
2024-07-17
2025-01-03
2024-08-13
2024-07-11
2024-06-24
2024-08-27
2024-07-13
2024-06-10
2024-07-12
2025-02-13
2025-01-14
2025-01-10
2025-01-06
2025-01-02
2024-12-16
2024-12-10
2024-12-04