微信扫码
与创始人交个朋友
我要投稿
在上一篇《向量数据库漫谈》结尾留了两个小问题,这次先来说第一个:向量数据库到底算不算NoSQL数据库。关心结论的可直接拖到底部,感兴趣过程以及国内外AIGC产品对比的可以仔细看看中间的问答截图 - 是的,本文还考虑过另一个题目“国内外六大AIGC平台横评:以向量数据库定义研究为例”。
出乎我的意料,貌似很简单的问题,在搜索引擎上竟不太容易找到直接的答案。事实上,有趣的是中文互联网和英文互联网对于这个问题的解释是正相反的:
中文网站中大多间接表示向量数据库和NoSQL不是一回事。
英文网站中则明确定义向量数据库是一种NoSQL数据库。
以此询问各家大模型,国内平台之前(大概一个月前)普遍认为二者是不同的,但现在大多改口为向量数据库的确是非结构化数据库的一种,不知是不是因为近期快速迭代模型的结果。
文心一言:之前一口咬定向量数据库不是非关系型数据库,最新的解释则折中的说”可以是“,但第二段的解读有点似是而非。
通义千问:和文心类似,也似乎在近几周内模型有了增强并改口,但同样在追加说明部分欠缺了些逻辑性。
讯飞星火:之前没有测试这个平台,此次提问,第一次得到“向量数据库NoSQL一种”的回答,但答案过于简单。让其重新生成回答后,没有禁住考验,给出了相反的答案。(但其他两个国产大模型在“重新生成”这个功能上的表现更差,不管点多少次,生成内容都是一模一样的...)
相比而言,国外的三款大模型的表现还是较好,回答的完备性和合理性更高一些。
ChatGPT 3.5:以英文提问,“fit within the broader classification of NoSQL database”说在点上了,当然整体而言也干货少,灌水多。以中文提问时,直接回答也是废话多,但对反向提问的回答还算比较有帮助:就是由于设计原理、数据模型和应用场景不同,向量数据库有时也会被认为不同于传统的键值、文档等非关系型数据库。
Bard:我个人认为是三款国外产品中表现最好的,在给出肯定回答的同时还以列表形式清楚说明了两者差异,对反向问题的回答也前后逻辑一致,基本观点是向量数据库是一种特殊NoSQL,同时也表示反对意见有其自身的逻辑基础。
Claude:Claude在准确性和简洁度上虽然比不过Bard,但跟牠对话的确更像和一个真人交流,当然目前看来代价还是话有点密。从下面对话链看到,较其他平台而言,Claude每一次生成的内容都更详尽且相关。尽管Claude在开始也认为向量数据库不属于NoSQL,但由于其内容生成质量较高,因而更容易与其形成互动,并能逐步形成兼有正反观点、比较全面的讨论。
总结一下,我认为基本可以参考Bard来人工生成本文主旨问题的答案:由于符合NoSQL数据库“非关系型”分类的基本定义,向量数据库可视为一种特殊类型的NoSQL数据库,但由于设计原理、使用场景的确存在一定的差异,特别是面向的数据结构不同,有部分人从约定俗成的角度认为,NoSQL仅关于键值、文档、列、图等数据类型,因此存储和处理向量数据的数据库不算NoSQL。
从工具评价的角度看,AIGC为研究提效的前景还是很明确的。目前在研究理解以及对比技术概念、原理和趋势的时候,AIGC工具在一定程度上已经可以作为与搜索引擎等效的工具,特别是在业界(训练数据中)已有基本共识的问题上,各家产品大致都已能有效降低知识获取的门槛、充当比较靠谱的专家,比起原有的搜索引擎工具而言对入门者更为友好。对于复杂问题辨析等场景,则还是需要研究者具备一定的先验知识和逻辑推理能力。相信配合私域数据及知识图谱等资源和技术,未来AIGC能在企业知识管理和知识服务场景中有更有效和普遍的应用。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-01-02
2024-07-17
2025-01-03
2024-07-11
2024-07-13
2024-08-13
2024-06-24
2024-06-10
2024-07-12
2024-08-27
2025-01-14
2025-01-10
2025-01-06
2025-01-02
2024-12-16
2024-12-10
2024-12-04
2024-12-01