我要投稿

看了Kimi的知识库接口文档，你还敢用吗

发布日期：2025-01-26 17:01:01 浏览次数： 2997 作者：纵横AI大世界

最近刚好想基于Kimi来搭建本地私有知识库，调研了几家服务商，比如deepseek，阿里云等。

虽然deepseek v3的发布让外界对其大加赞叹，着实让中国人扬眉吐气了一番，但是deepseek的文档实在是太简陋了，一看就是那种基本功能还不完善的样子：

研读了几遍，没有找到我想要的知识库接口，虽然有第三方工具，但是短时间内搬迁过来不容易，先找找有没有现成可用的吧。

第二家服务商是Kimi，国内大模型创业公司较早杀出来的一批黑马，阿里云曾投资过。

相比deepseek，kimi的文档要完善得多：

而且有我想要的接口，比如这个上传文档的接口，兼容OpenAI：

from pathlib import Pathfrom openai import OpenAIclient = OpenAI(    api_key = "$MOONSHOT_API_KEY",    base_url = "https://api.moonshot.cn/v1",)# xlnet.pdf 是一个示例文件, 我们支持 pdf, doc 以及图片等格式, 对于图片和 pdf 文件，提供 ocr 相关能力file_object = client.files.create(file=Path("xlnet.pdf"), purpose="file-extract")# 获取结果# file_content = client.files.retrieve_content(file_id=file_object.id)# 注意，之前 retrieve_content api 在最新版本标记了 warning, 可以用下面这行代替# 如果是旧版本，可以用 retrieve_contentfile_content = client.files.content(file_id=file_object.id).text# 把它放进请求中messages = [    {        "role": "system",        "content": "你是 Kimi，由 Moonshot AI 提供的人工智能助手，你更擅长中文和英文的对话。你会为用户提供安全，有帮助，准确的回答。同时，你会拒绝一切涉及恐怖主义，种族歧视，黄色暴力等问题的回答。Moonshot AI 为专有名词，不可翻译成其他语言。",    },    {        "role": "system",        "content": file_content,    },    {"role": "user", "content": "请简单介绍 xlnet.pdf 讲了啥"},]# 然后调用 chat-completion, 获取 Kimi 的回答completion = client.chat.completions.create(  model="moonshot-v1-32k",  messages=messages,  temperature=0.3,)print(completion.choices[0].message)

它支持的文档格式非常多，不仅支持文本文档，还支持图片格式。估计是最全的一家吧，连阿里云都没有这么多，后续再讲阿里云。

上面示例中是提取文本内容，要知道提取文件后的内容可能非常大，比如一本书，都几十万字到几百万字，这样来回跟大模型交互，这个成本估计真的是要命。

为了解决这个问题，Kimi也算是很贴心了，她跟我们提供了context cache，上下文缓存技术服务：

Context Caching （上下文缓存）是一种高效的数据管理技术，它允许系统预先存储那些可能会被频繁请求的大量数据或信息。这样，当您再次请求相同信息时，系统可以直接从缓存中快速提供，而无需重新计算或从原始数据源中检索，从而节省时间和资源。使用 Context Caching 时，首先需要通过 API 创建缓存，指定要存储的数据类型和内容，然后设置一个合适的过期时间以保持数据的有效性。一旦缓存创建完成，任何对该数据的请求都会首先检查缓存，如果缓存有效，则直接使用缓存（此时已缓存的内容将不再收取 Tokens 费用），否则需要重新生成并更新缓存。这种方法特别适用于需要处理大量重复请求的应用程序，可以显著提高响应速度和系统性能。

Context Caching 特别适合于用频繁请求，重复引用大量初始上下文的情况，通过重用已缓存的内容，可以显著提高效率并降低费用。因为这个功能具有强烈的业务属性，我们下面简单列举一些合适的业务场景：