12345在线客服机器人
在线客服行业这几年蓬勃发展,很多大公司以及政府部门采用了在线客服系统,节约了大量人力。
2018年5月23日,中共中央办公厅、国务院办公厅印发了《关于深入推进审批服务便民化的指导意见》,意见提出建立“12345”统一政务咨询投诉举报平台。以设区的市为单位,除110、120、119等紧急类热线以外,将各部门非紧急类政务热线以及网上信箱等网络渠道整合,纳入12345统一政务咨询投诉举报平台统一管理,建立“统一接收、及时分流、按责转办、限时办结、统一督办、评价反馈、行政问责”的运行机制。
2021年1月6日,《国务院办公厅关于进一步优化地方政务服务便民热线的指导意见》印发。《意见》要求,加快推进除110、119、120、122等紧急热线外的政务服务便民热线归并,2021年年底前,各地区设立的以及国务院有关部门设立并在地方接听的政务服务便民热线实现一个号码服务,各地区归并后的热线统一为“12345政务服务便民热线”,提供“7×24小时”全天候人工服务。同时,优化流程和资源配置,实现热线受理与后台办理服务紧密衔接,确保企业和群众反映的问题和合理诉求及时得到处置和办理,使政务服务便民热线接得更快、分得更准、办得更实,打造政务服务“总客服”。
各地12345在开展线上客服机器人服务方面进行了多方面探索,与国内诸多知名公司进行了合作,但效果并不尽如人意。原因主要在以下几个方面:
第一:目前一些大公司使用的在线客服机器人也只能解决一部分问题,用户满意度不高,并不能满足12345的需求。
第二:众多在线客服机器人技术提供方提供的产品不能处理句子语义,只能处理关键字,本质上还是搜索。在网页上通过推荐和分类能解决一部分问题,如果放在语音交互场景,用户体验就会很差。语音交互需要给用户具体答案,需要机器人能理解用户语义。这是大多数在线客服机器人公司做不到的。目前国内众多机器人公司采用的都是开源的技术方案,自己不研究底层技术,对提高机器人的回答准确率无能为力。
第三:12345的数据来源复杂,数据格式不统一,数量庞大。仅仅处理一个政府部门的问答数据对于一些客服机器人公司来讲已经是海量工程了。12345这样庞大的数据量对大多数客服机器人公司来讲都是无法完成的项目。
数据量一大,冲突的地方就很多。比如:“请输入您的身份证号”在12345这个机器人知识库里可能会有很多。输入身份证号以后下一步怎么操作?如果机器人能力有限,就不能准确跳转到下一步。
即便有方案能解决数据训练的问题,需要的费用可能是个天文数字,谁来承担这笔费用呢?
第四:以什么格式存储和维护数据也是个问题。有些客服机器人公司以QA形式存储数据。QA存在的问题就是无法了解知识盲区,也无法统计重复知识。可能该存储的知识没有存储到知识库,用户提问时机器人无法回答。QA无法提供工具去分析知识盲点。同一个问题如果不同的编辑人员维护的知识库,可能答案是不一样的。这样重复的回答,不仅仅浪费资源,而且容易造成混乱。
如果采用知识图谱方式存储知识,则存在回答不准确的问题。知识图谱存储也存在训练成本高,维护难的问题。
第五:用户的个性化表达、口语化表达、不规范表达、方言表达给语义理解带来挑战。12345面对的用户文化层次参差不齐,他们的表达是纯自然语言。比如对于“社保如何迁出”这个知识点,用户的表达可能是“我在北京上班了,怎么把我的社保迁到北京”“我想把社保转到北京怎么处理”“请告诉我怎么把社保迁往外地”“社保办到外地怎么处理”“我快退休了,能把社保转到外地吗”“我想把社保转去营口咋搞”。如果用关键字模糊查询,就需要做大量穷举,让知识库建设成为不可能完成的事情。一些技术处理文本,在语义不变文本稍微不同的情况下就不能准确理解语义,这样的技术是无法处理自然语言表达的。
在目前人力成本不断提升,招工难的大背景下,推进12345客服机器人的研发十分必要。但12345客服机器人是个巨大工程。它不仅仅是技术难度大,而且是工作量大。
氖星智能经过20年的技术积累,经过10年的产品完善,目前推出的氖星机器人大脑平台及氖星机器人世界能满足12345这样的复杂需求。氖星机器人大脑是客服机器人的内核,它负责分析用户输入的语义,处理自然语言。机器人世界是由众多客服机器人构成的机器人集群。用户在机器人世界提问时,众多客服机器人根据一定规则抢答用户提问。
简介如下:
第一:氖星智能研发了20年的句子语义理解技术能处理口语输入、不规范输入、方言输入、个性化输入等自然语言现象。能从复杂不规范的句子里抽取出标准的语义。“告诉我怎么办理社保转移”“你说说社保转出怎么办”“我想把我的社保转出去怎么弄”“我想帮同事办理社保迁出怎么办”等等句子,我们认为语义有相似性。
氖星智能用句子主干表示句子语义,对比句子主干计算语义相似性。在实践中,机器人回答准确率明显高于同行。在问答中能准确回答用户提问,很少出现推荐菜单。
氖星智能语义理解算法自主研发,完全未使用开源技术,自主可控。我们有人专门负责语义理解算法不断升级。我们能保证12345机器人回答准确率不断提升。
第二:氖星智能的知识存储是按语义图谱存储的。语义图谱是对知识图谱的升级。语义图谱以知识点为存储知识的关键。语义图谱存储能避免QA存储知识重复存储和遗漏知识点的问题。
在回答问题时,语义图谱的回答更加标准规范。
第三:氖星智能机器人世界是机器人集群,非常适合12345这样大集群的客户。政府各委局厅办可以在我们平台开设自己的机器人账号,回答时通过统一界面回答问题。每个单位一个独立的机器人、独立的知识库,用户独立维护。用户提问时,机器人抢答,抢答到问题的机器人回答用户提问。抢答是根据用户提问匹配的,一个问题只由特定机器人回答一次,并且能做到准确回答。
给各个部门分配账号,把知识库建设的工作压力分散到各个部门,化整为零,降低成本提高效率。维护知识库也是非常专业的事情,由各个部门维护自己的知识库能保证知识库的准确性和实时性。
通过机器人世界,让12345客服机器人这个巨大工程变成无数个独立可控的小工程。
每个账号下的客服机器人也可以独立工作,可以接入网页、公众号、智能硬件等等应用端。
通过机器人集群,也避免了把数据放在一个数据库造成的冲突。在每个独立的机器人知识库,氖星智能提供语义图谱存储技术,也让知识有机地组合了起来,避免了重复和冲突。
第四:氖星机器人大脑提供了许多开放接口,能让用户把自己的业务系统集成进来,能提供动态数据查询统计。比如:公积金、考勤系统、医院管理系统都能和氖星机器人大脑集成。用户可以通过氖星机器人查询自己的社保数据、公积金数据等等。
氖星智能的知识结构是多媒体的,允许机器人回答时同事输出图片、视频、声音等等信息。
第五:氖星机器人大脑已经成功运营了3年多,积累了大量客户,其中不乏政府项目。
综上所述,氖星智能机器人大脑和机器人世界能有效满足12345这种大工程的需求。