作者:Omkar Prabhune
翻译:方星轩
校对:王雨桐
标签:聊天机器人,神经网络,自然语言处理NLP
本文约2800字,建议阅读5分钟
本文作者从聊天机器人的种类、用途以及架构等角度介绍目前的聊天机器人技术,并在文末分享了一些聊天机器人行业的例子。
首先让我们先了解一些基础知识。聊天机器人(对话式 AI)是一种自动化程序,可通过文本消息、语音聊天来模拟人类对话。它根据大量输入和自然语言处理 (NLP) 学习如何做到这一点。
今天的聊天机器人在社交媒体、电子商务、客户服务甚至医疗保健的许多行业和公司中都是不可或缺的。一些典型的例子是微软的 Zo、IBM Watson 或 Rasa(一种用于构建商业用途的聊天机器人的工具)。
那就让我们来看看到底是怎么样的吧!
目录
聊天机器人的类型
基于规则的聊天机器人也称为决策树机器人。顾名思义,它们使用一系列已定义的规则。这些规则是聊天机器人熟悉并可以提供解决方案的问题类型的基础。
就像流程图一样,需要给聊天机器人设置对话框架。他们这样做是为了预测客户可能会问什么,以及聊天机器人应该如何回应。
基于规则的聊天机器人可以使用非常简单或复杂的规则,但是他们无法回答定义规则之外的任何问题。这些聊天机器人不会通过交互来学习。此外,他们只执行和处理被训练的场景。基于规则的聊天机器人有几个好处,例如:
相比之下,使用机器学习的 AI 聊天机器人会在回应之前了解问题的上下文和意图。
AI 聊天机器人是由自然语言处理提供支持的聊天机器人。因此与基于规则的聊天机器人不同,它不会使用关键字来回答,而会尝试了解客人的意图,即客人想要什么。它与客人互动得越多,就越能更好地理解意图,也就越能回答客人的要求。
他们的工作方式是捕捉问题或回应背后的意图。例如,用户会问类似“你好!你好吗?&39;甚至像&39;Heyooo&39;这样的东西。尽管这些差异很大,但机器人将意图捕获为“问候”,因此它会以与该内容相对应的对话进行响应。
可以说,基于意图聊天的聊天机器人也是基于人工智能的机器人。这些聊天机器人在半智能或完全人工智能支持的算法上运行。基于 GPT-3 构建的机器人就是一个完美的例子,它可以理解上下文并完全自行响应。
这种类型的机器人更适合复杂种类和大规模查询。选择 AI 聊天机器人有几个优势,例如:
尽管人工智能是一项先进技术,但该机器人也有其局限性:
聊天机器人架构
引擎是核心组件,可以在任何给定时间解释用户所说的话,并将语言转换为系统可以进一步处理的结构化输入。即使聊天机器人是特定于域的,它也需要包含和利用大量信息。而NLP 引擎对此有所帮助。
它包含先进的机器学习算法来识别用户的意图,并进一步将它们与机器人支持的可用意图列表进行匹配。可以理解为有两个组成部分:
意图分类器(Intent Classifier):意图分类器根据用户的输入识别其含义,并将其与聊天机器人支持的意图之一联系起来。
实体提取器(Entity Extractor):实体提取器从用户的查询中提取关键信息。
这是回答用户问题的关键部分。问答系统解释问题并从知识库中给出相关答案。它可以手动训练或自我训练。
手动训练涉及领域专家创建常见用户查询列表并映射其答案。这有助于机器人快速确定重要问题的答案。
自动化训练涉及将公司的文件(如政策文件和其他问答类型的文件)提交给机器人,并要求其进行自我训练。引擎从这些文档中提供了一系列问题和答案,然后机器人可以自信地回答。
数据存储只是针对以前交互的数据,以提供给 NLP 引擎,以便机器人在聊天期间保留一些上下文。这对于记住有关用户的知识以进行进一步交互尤其重要。
聊天机器人中的自然语言处理找到了一种将用户的语音或文本转换为结构化数据的方法。然后用于选择相关答案。自然语言处理包括以下步骤;
标记化(Tokenization):NLP 将一系列单词分成具有语言代表性的标记或片段,在应用程序中具有不同的值。
行业实例
Meena 是一种端到端的神经会话模型,它可以学习对给定的会话上下文做出明智的响应。训练目标是最小化困惑度,即预测不确定的下一个标记(在本例中为对话中的下一个单词)。
其核心是 Evolved Transformer seq2seq 架构,这是一种通过进化神经架构搜索发现的 Transformer 架构,以改善困惑度。在 Google 的 AI 博客中了解更多信息。
更多信息
http://ai.googleblog.com/2020/01/towards-conversational-agent-that-can.html
Replika 由 Eugenia Kuyda 创立,其想法是创建一个私人人工智能,通过提供有用的对话来帮助您表达和记录自己。这是一个您可以安全地分享您的想法、感受、信念、经历、记忆、梦想的空间——您的“私人感知世界”。
从本质上讲,Replika 是一个聊天机器人,在与您交谈时,它会逐渐学会模仿您,直到成为您为止。
Tay 是一款人工智能聊天机器人,最初由微软公司于 2016 年 3 月 23 日通过 Twitter 发布;当机器人开始通过其 Twitter 帐户发布煽动性和攻击性的推文时,它引起了争议,导致微软在推出后仅 16 小时就关闭了该服务。从那以后,它被视为关于用户交互如何破坏聊天机器人的研究案例。
参考
在完成本文的过程中,我们参考了以下几个来源。除此之外,如果您对学习或开发聊天机器人感兴趣,我们欢迎您查看 Rasa,这是一个用于开发聊天机器人的流行开源库。在 Medium 上还有 Chatbotslife 杂志!
参考来源:
“Towards a Conversational Agent that Can Chat about…Anything”, Google Research: Brain Team, 2020
“Understanding the Architecture of Conversational Chatbots”, VSoftConsulting Blog, 2019
“The Rise of Social Bots”, Ferrara Emilio, Varol Onur, Davis Clayton, Communications of the ACM, July 2016
“Why Microsoft&39;s ‘Tay&39; AI bot went wrong”, Hope Reese, Tech Republic, March 2016
原文链接:
http://medium.com/@OverPoweredDev/machine-learning-in-chatbot-development-99a6c011483f
原标题:
Machine Learning in Chatbot Development