我要投稿

（注：此方式不适合金融催收类外呼机器人）

发布日期：2024-05-11 07:33:54 浏览次数： 2822

作者：智能客服研习社

微信搜一搜，关注“智能客服研习社”

“机器人为什么不能很好地命中预设问答？我们知识库里有许多相关的相似问，但当用户的提问中明确有与知识库内高度相似的相似问时，机器人有时仍然没法准确命中。

只要用户问题中包含了某个“关键词”，就一定会命中答案，这其实是一个认知误区，实际情况并非如此。

结合这个问题，讲一下提问被「命中」的原理，以及如何「提升命中率」。

一、使用率最高的3匹配规则

常规来说，访客的“提问”与知识库的“相似问”匹配的模式有3种：【完全匹配】、【包含匹配】、【智能匹配】。

1.完全匹配：“query”要与“相似问”完全一致

相似问：“帮我办理分期还款”（那么访客的提问必须完全与预设一模一样，才算作完全匹配，在NGD平台称为相似度100%）。

query1：“帮我办理分期还款” （完全匹配）

query2：“要不还是帮我办理分期还款吧”（非完全匹配）

2.包含匹配又称（关键词匹配）

在相似问内使用问答模板只要提问包含预设的关键词，就会命中。

相似问：“分期”二字为某个预设问答的关键词。
query：用户的提问中包含了“分期”二字，就会直接命中。

问题：这种模式看似合理，但有一个问题，在知识库中，只能有唯一一个以“分期”为关键词的相似问，不然就会冲突。但实际业务中，与“分期”的提问场景有很多，不同场景对应的回答都不相同，推送同一个回答显然不合理。
适用范围：包含匹配模式比较适合业务相对简单，或某个关键词对应提问场景非常单一的情况下使用，大多数提问仍然要靠其它的方法来覆盖。

3.智能匹配

通过算法，综合计算“query”与“相似问”的相似度进行直出相似问，相似问的相似度由高到底进行直出。

「智能匹配」的规则应用更为广泛。这种模式是通过NLP语义识别+多重复杂的方程运算，逐次计算访客“提问”与知识库中“预设问答”的相似度，计算逻辑很复杂。这种规则适配性较高，对用户的提问内容并没有太多限制，更主要的是去分析访客想表达的含义，但同时也给机器人增加了识别的困难程度，特别是对外呼型机器人来说，因为牵扯到【text、ASR、NLP】三种模型之间的配合。

二、命中率低的原因

智能匹配被应用的太简单是导致命中率低的主要原因智能匹配的运算过程是比较复杂的，在实际生产环境应用时需要持续的打磨，这样才能让命中效果越来越好。如果没有足够的时间进行优化的话，会导致用户的提问很难与预设问答相匹配。在智能匹配中，“query”-“相似问”的匹配程度，用“相似度”作为标准，相似度越高命中率就越高。

query-相似问根据相似度由高到低直出相似问）

举个例子

用户提问：老婆刚怀孕家里实在是没钱了，可以分期吗
命中的标准问：不分期不还
相似度最高的相似问：没钱，你分期了再还

在上面图片展现的这个例子中可以看出，用户的真实意图是想办理分期，应该命中“可以分期还款吗”这个标准问，但是却误命中到了“不分期不还”这个标准问。

问题：错误命中
解决方法：分别优化“可以分期还款吗” 和 “不分期不还”这两个标准问内对应的相似问
目的：提升用户提问与相似问之间的相似度

因此，如果希望机器人能够更准确、更大覆盖的识别query，核心是要提升在智能匹配规则下，qyery与相似问的「相似度」，才能进而提升机器人的直接回答率。

三、3个视角全面提升机器人直接回答率

想要有效提升「直接回答率」，需要从覆盖、命中、引导3个不同的视角来做全面优化。

1.覆盖更广

要保证尽可能多的“query”都转化成了“相似问”这一点是机器人能独立解决更多提问的核心基础，即在知识库中，要有足够覆盖业务的预设问题方向。以及知识库的后期持续的维护。

日常需要开展：分析访客提问 → 发现未知问题 → 补充合理回答 → 加入知识库的相似问循环此动作。

2.命中更易

适量扩充相似问，尽可能接近于用户的实际“query”接下来，就是要让用户的提问，最大程度的命中正确的相似问。添加相似问，便是提升「query-相似问」相似度的核心动作。相似问，可以理解为是针对某一预设提问“不同问法”的集合。

相似问与用户提问越接近、越全面，命中概率越大。

3.引导更准（注：此方式不适合金融催收类外呼机器人）

清晰的标准问，让用户正确的选出他想要的答案当相似度在40%-80%之间时，机器人会自动推送多个同属这个区间的“标准问”，供用户自己选择。这时候，标准问的清晰程度，将直接决定用户是否“能选对”，也决定了基于用户选择而拓展的相似问是否准确。标准问的设置一般有两种误区。仍以优惠券为例，一种误区是描述很复杂，如“我想买东西，看到有优惠券，但不知道如何使用”，这种描述中加入了太多描述、限制，使标准问变得冗余，在主动给访客推送候选问题时，这样的描述容易给访客造成困扰；另一种误区是描述太简单，例如只有“优惠券”三个字，这种又太过宽泛，访客仍然不清楚这个提问代表的含义。正确的做法，是尽量简明、清晰的预设标准问，如“优惠券怎么使用”就可以是一个比较合适的预设方法。可不要小看标准问，用户的正确点选将直接影响到其相似问的拓展精度，对提升命中率有至关重要的作用。