2018年初开始流行的直播答题游戏遭遇人工智能(AI)的挑战。AI辅助答题软件真能帮你通关吗?背后用了怎样的技术?直播答题平台如何应对?
记者采访了AI辅助答题软件的研发人员、AI行业专家和直播答题平台方,针对上述问题进行了探讨。
直播答题遭遇AI“搅局”
在线答对全部题目即可瓜分奖金——从规则来看,直播答题的本意是拼智力赢钱。但是,在你绞尽脑汁答题的时候,有人动动手指就找到了答案。
他们借助的是人工智能软件,可以识别屏幕上的问题并迅速给出答案。目前比较流行的有百度的“简单搜索”、搜狗的“汪仔答题助手”等。
“简单搜索”(左)和“汪仔答题助手”页面。
那么,一个普通人,真能在这类人工智能软件的帮助下顺利通关吗?
记者此前测试发现,AI软件的正确率每场差别很大。以“简单搜索”为例,1月12日晚11点“百万英雄”场,12道题目全部答对。但1月14日下午5点“冲顶大会”,AI在多道题目上宣布放弃,甚至一度出现卡顿。
背后用了怎样的技术?
从测试来看,AI答题软件有时会非常聪明。它们是如何找到正确答案的?
“汪仔答题助手”团队负责人告诉记者,首先,答题助手通过图像识别等技术抽取问题和候选答案,并将对应的文本数据发送给搜狗“立知”问答系统。
“其次,搜狗‘立知’系统利用自然语言处理技术分析问题,然后从上千亿互联网资源中检索出与问题相关的文档集合,并通过深度语义理解技术,从文档中抽取候选答案。”该负责人说,每个候选答案有一个置信度,最后结合题目中给出的候选答案,综合判断出正确答案。
在这一过程中,自然语言处理技术发挥了关键作用。
“简单来说,自然语言处理技术就是让机器理解人说的话。”大拿科技创始人、机器学习专家陈明权说,自然语言处理技术虽然还没有那么高级,但可以用来做不错的搜索。
竹间智能创始人简仁贤曾经领导了微软AI聊天机器人“小冰”的开发,他告诉记者,具体来看,将AI技术应用于在线答题主要还是建立在自然语言理解、搜索引擎以及知识图谱技术之上的。
“比如关于‘姚明身高是多少’的问题,有一个实体是‘姚明’,他有一个属性是‘身高’,对应的值是‘多少米’,这首先是建立在对问题的自然语言理解基础上,然后结合预先建立起的知识图谱,在此基础上搜索之后找到答案。”简仁贤说。
一用户借助人工智能工具辅助直播答题。
AI软件答题的弱点在哪里?
记者体验发现,对于文学、历史等领域知识类的题目,AI软件更容易答对,而对于需要推理的数学题则较难给出答案。
比如,有题目问“上一个四级阶梯,若每次只能跨过一级或两级阶梯,有几种方法上去?”AI软件干脆选择“放弃”。
对此,“汪仔答题助手”团队负责人说,对于不涉及复杂推理的知识类题目,AI软件比较擅长。
“机器能进行简单推理,例如,‘小红爷爷的名字叫小白,小红爸爸的名字叫小黑,那么小黑的爸爸是谁?’对于这样的逻辑,机器是可以推理出来的。”陈明权说,但是涉及复杂推理的题目,现在的机器根本做不到。
简仁贤说,有些题目会涉及到很多层的推理,就不能简单依靠搜索技术与知识图谱的构建。推理也是人区别于人工智能最大的优势之一,也是现在人工智能难以实现的。但在复杂知识的记忆和检索上,人工智能具有巨大优势。
另外,记者注意到,在答题时,与一些语音识别的智能音箱相比,“简单搜索”、“汪仔答题助手”等通过图像识别问题的AI软件准确率更高。
“图像中的文字识别已经非常成熟了,如果文字像印刷稿一样非常规范,那么准确率可以达到99.9%。”简仁贤解释说,但是语音识别容易受环境影响,在嘈杂背景下识别准确度将大幅降低。
图为“简单搜索”答题页面。机器人有时回答正确(左),有时也会选择放弃。
直播答题平台该如何应对?
AI答题软件出现之后,有些直播答题平台对题目的设置进行了调整。
例如,今日头条“百万英雄”推出了个性化题目,不同用户的手机屏幕显示的选项有所不同,正确答案也不只一个。
今日头条方面告诉记者,推出个性化题目一方面确实考虑到要避开AI答题软件的干扰,另一方面也是为了增添答题的趣味性。
直播答题平台还有什么方法可以避开AI软件?简仁贤认为,只能在出题上下功夫,多出推理类和理解类的题目,同时采用复杂语句进行提问,增加语义理解的难度。
谈到直播答题遭遇AI“搅局”,陈明权说,“直播答题的商业模式其实很厉害,短时间内就吸引到很多流量,并且植入了广告。但哪能想到,人工智能会参与进来,并在一定程度上影响了直播答题的用户体验呢?”
“你有盾,人家就有矛,未来搞商业创新的话,要想想人工智能是不是能破你这个盾。”陈明权说。