找回密码
 立即注册

QQ登录

只需一步,快速开始

IBM辩论机器人掌握语言能力了吗

|原发: 企业观察报

放大 缩小

本报记者/钱馨瑶


美国当地时间6月18日,旧金山IBM办公室,人工智能在一场辩论赛中击败了人类顶尖辩手。参战的是IBM Research最新推出的AI系统Project Debater,它的对手是以色列国际辩论协会主席Dan Zafrir和2016年以色列国家辩论冠军Noa Ovadia。


这次辩论赛分为两场,第一场的题目是“我们是否应当资助太空探索”,Project Debater为正方,而反方则是2016年以色列全国辩论冠军奥瓦迪亚(Noa Ovadia)。


第二场议题则是“我们是否应当更多地使用远程医疗”,Project Debater依然是正方,另一位以色列国际辩论协会主席扎夫里(Dan Zafrir)为反方。辩论规则为双方各发表4分钟的开场演讲,在接下来4分钟内各自进行反驳,最后用2分钟进行论证总结。


Project Debater的自我操控


IBM研究对话式人工智能已经多年,此前推出了“沃森”(Watson),Project Debater是最新的成果。据IBM官方介绍,Project Debater是第一个可以在复杂话题上与人类辩论的AI系统。它的外形不得不说有些“严肃”,Project Debater的外观就像是一块黑色大石头,在屏幕上有三个漂浮的蓝色小圆。


Project Debater通过处理大量文本,就特定主题构建出有良好结构的演讲,提供清晰明确的目的,并反驳其对手。最终,Project Debater将通过提供引人注目的、以证据为基础的论点并限制情感、偏见或模棱两可的影响来帮助人们推理。


IBM Research首席调查员兼Project Debater创造者表示,Project Debater项目六年前就开始了,而在两年前才开始能够参与人们的辩论。Debater的辩论智能来自于数以亿计的期刊和报纸文章。


在比赛之前,Project Debater并不知道辩题。除了辩论开始的问候和笑话之外,论辩的陈述都是Project Debater自由发挥的,没有固定的陈述词。当Project Debater获得一个新的话题时,它会在其文章语料库中搜索与该主题相关的句子和线索,用来支持其辩方论点。根据所有的相关内容,它会试图去理解辩论的主题,然后组织自己的陈述。


Project Debater将多种算法与AI技术组合在一起。在过去几年里,IBM研究院已经在学术报告中详细介绍过。当人类将主题告诉计算机,它会扫描数据库,数据内包括海量新闻、学术论文,它会用算法做出判断,看看哪些文本相关性最高,观点性很强。还有一种算法会减少重复。在辩论过程中,语音识别系统会倾听机器的对手说了什么,如果机器人出现误听,系统会在出错的地方增加另一个层。研究人员说,Project Debater可以应付任何观点性主题,不管有没有针对此主题训练过都能处理。


在双方结束总结后,多数观众认为人类表达得比较好,不过Project Debator 传递信息量的丰富度则优于人类,而且在第二场的“我们应该增加使用远程医疗”辩论,观众则认为 Project Debator 的游说能力较强,例如有 9 位观众在听完 AI 辩论后而改变了立场。看来在这场与人类的友谊赛,AI 的表现算是不错。


对于Project Debator来说提出一个观点非常容易,它可以引用一些消息来源并且很明显有些观点是从一些文章中摘编出来的。尽管如此,它还是能够从我们通常认为的“现有信息”模式转变为我们听到的由AI输出的“观点信息”模式。但是更令人印象深刻的是,它试图与人类现场提出的观点进行实时辩论。毕竟人工智能系统需要通过几分钟才能分析人类四分钟的讲话,然后才能做出回应。


对于本次辩论赛,IBM AI和量子计算研究部门副总裁吉尔(Dario Gil)表示:“我们并不特别在意谁赢谁输,我们更在意的是AI处理人类思考模糊性、现实性和语境的方式。我们想看看它是否能写好“辩论”观点,以及内容是否有说服力、能否提供恰当的例证。”


六年研制AI辩论能力


IBM已经花了6年的时间来开发Project Debater的辩论能力,包括数据驱动的演讲能力,在演讲中识别关键声明的听力理解以及制定原则性论据的能力。它扩展了IBM超级计算机Watson的功能,公司正在使用它来挖掘庞大的内部数据集,包括帮助医生诊断不同类型的癌症。


近70年来,人工智能系统在一定程度上是通过学习西洋跳棋和国际象棋等游戏而发展起来的。1997年,IBM的深蓝程序在国际象棋中击败加里卡斯帕罗夫(Gary Kasparov );2011 年,IBM Watson 在《危险边缘》(Jeopardy)比赛中取胜。几年后,Google 的 Alpha Go 打败了顶级围棋冠军;一个名为Libratus的程序击败了全球四大顶级扑克玩家。而这次里程碑式的辩论发生在人与机器之间的多次相似的对决之后。


IBM表示,要训练一台机器人与人类进行辩论,必须克服3个主要障碍。第一,系统必须大量收集信息、分析信息,从中提取出有用的内容。其次,“辩论者”必须能够倾听和理解对手的论点,识别其概念和主张,从中找到弱点。最后,该体系必须认识到人类思考中的争议盲点,才能“提出有原则的论点”。


以上的一切能力,都是为有朝一日开发出完全基于人类语音的应用程序做准备。截至目前,消费者能使用的技术,如Siri、谷歌助手和Alexa,还远不具备和人类对话的能力。离人类真正依靠电脑做出决策,还有很长一段路要走。而这,正是IBM现在在走的路。


用语言和推理来辩论是一个更加复杂的游戏。“国际象棋的规则很少。即使对于更为复杂的围棋来说,我们仍然在谈论一个非常有限和明确界定的空间”。参加辩论的邓迪大学技术中心教授Chris Reed说。“对语言而言,它不是那么明确。”他说。“关于什么构成转折和游戏规则,灵活性更大。”


一旦人工智能具有说服力的论点,就可以将其用作辅助人类决策的工具。


掌握语言能力没那么简单


人工智能的语言对话能力一直是科学家及企业希望能获得大幅突破的领域,IBM 的辩论 AI 属于大型资料查找、分析、用以帮助做决策,展现了人类理性的一面。另外则有不少人希望让 AI 有人类的感性,包括闲聊机器人、或是Google或微软已投入众多资源的 Duplex 语音技术,则是希望让 AI 在对话时能有人类的口气。


IBM 负责AI的副总裁 Dario Gil 接受采访时表示,“这一计划的挑战在于脱离传统的游戏环境,尽管游戏可能很复杂,但你最终处在一个独立封闭的体系中。有一些规则需要遵守。将人工智能引入一个开放性问题领域非常有趣。问题是这能否实现?”


以色列的研究员RanitAharonov坦言这个项目是有限的,掌握语言还有很长的路要走。但是,Aharonov认为该技术可以有一系列实际用途,它可以帮助人们做出一个关键的决定,例如,通过提供一系列“支持”和“反对”的论点。与此同时,Aharonov的合作者Noam Slonim表示:“风险总是存在的,我实际上认为,与其他技术相比,它的局限性更大。”


西雅图艾伦人工智能研究所的首席执行官Oren Etzioni表示,仅凭这场竞赛很难判断IBM系统的能力。他说:“相比开放的演示,人们更容易将一个罐头演示整合在一起,让你以一种自然的方式与之互动。”


西北大学教授、NarrativeSciences创始人Kristian Hammond表示,这项技术可能被证明是有用的。但哈蒙德强调,IBM的软件只是在重复它所挖掘出来的东西。他表示:“在任何阶段,系统都不知道自己在说什么。在人类中,我们认为这是愚蠢的推理。”


IBM 也表示,辩论规则源自于人类的讨论文化,而非随意的对话,Project Debater 必须适应人的理性,并提出人们可以遵循的论点。因此,在辩论中,人工智能必须学会在凌乱的非结构化人类世界中抓住方向,而不是像在棋盘游戏中那样使用预先定义的规则。基于上述原因,Project Debater 有时也会犯错。但 IBM 认为,虽然该项技术的工作远未完成,但它有可能帮助解决数千个复杂的人类决策,例如,金融领域、公共政策,未来 Project Debater 的基础技术将在 IBM Cloud 和 IBM Watson 中商业化。


据另外两位IBM研究员Noam Slonim和Ranit Aharonov所说,发明这款机器的真正目的是通过其无偏见论述以帮助人类建立充分知情的论点并做出更好的决策。


对于Project Debater在未来领域的应用,核心的疑问是这款人工智能是否能准确帮助人类阐释问题的原因。AXIOS在报道中指出,若仅仅提供数据驱动的输出而不做任何后备算法,其结果走势不仅容易出错,甚至可能是不道德的。


除此之外,IBM 希望继续开发人工智能系统,推动 Project Debater 实现更加伟大的成就。


“IBM研究部门主管Arvind Krishna说:”我们相信人工智能具有很好的可以理解我们人类的巨大潜力。


Project Debater将扩展沃森的功能,目前数十家公司正在使用沃森的功能挖掘大量内部数据集以获得新的业务洞察力。该系统已经使用了Watson Speech to Text API,并将有助于增强沃森的高级语言和对话功能。未来,它的基础技术也将在IBM云平台和IBM沃森中商业化。


链接


独家专访IBM:AI辩论机器现在是怎么做的,以后能做什么


6月20日,IBM推出的名为“IBM Project Debater(下文也称Debater)”的AI机器在辩论赛中大胜以色列国家辩论赛的冠军,并引起了业界轰动。


与此同时,诸多业界人士也对Debater的核心技术与商业价值表示疑问:Debater究竟是如何运作的?使用哪些机器学习技术?是如何实现精确的语音语义识别和自然语言处理的?相应的数据训练集又是如何组织起来的?腾讯科技独家专访了IBM Project Debater相关团队,对这些诸多问题进行了逐一解答。


IBM Project Debater 通过给定主题搜索论点


在与人类辩手的这场辩论中,主题或论点来自维基百科中的常见论点。


只要给定Debater一个主题,该系统就能够进行搜寻大量的知识,寻找最相关的观点和证据来支持或反驳主题。随后,机器会挑选出最有说服力、最具多样性和支持最完善的论点,并对这些论点进行编排,从而形成一段完整且有说服力的叙述。


Debater 可通过结构来发现正反两方的论点,不偏向任何一方。只要语料库中有充足的主张和证据,Project Debater 可就任何主题进行辩论,即可作为正方,亦可作为反方参与辩论。


IBM Project Debater涵盖海量的语料数据库


那么针对主题的这些语料库都是怎么得来的呢?IBM Project Debater负责团队表示:Debater 采用了IBM Watson Text to Speech 和 Speech to Text API语料库,其涵盖了3 亿多个信息来源,包含 2011 年以来全球商业、法律、学术和政府机构等领域的专业人士所使用的主流报纸和杂志中的文章(包括维基百科)。


为了训练机器对语料库数据上的深度学习,IBM开发了几个基准数据集。其中一些数据集专注于计算论证任务,而另一些则与更广泛的自然语言处理(NLP)研究社区相关。其中包括:19,276 对根据可读性打分的维基百科词条 、5,000 个带有情感注释的习语、3,000 个带注释的句子、2,394 个关于 55 个话题的分类论点、60 篇专业辩手关于争议性话题的演讲稿(包括草稿和不带修订的版本)。


此外,训练过程中还加入了人工的参与。Debater团队负责人对此表示:“在训练过程中,我们与十几位辩手开展合作,他们有的是非常专业的辩手,有的在大学期间就参加过辩论赛。”


IBM Project Debater具备三大机器学习能力


为了开发 Project Debater,IBM 研究团队为该系统赋予了三大机器学习能力:


首先是在数据驱动下的演讲稿撰写与表达能力,以便于计算机能够理解大量语料库,使机器能够根据主题撰写结构良好的演讲内容,并清晰且有针对性地表达出来,甚至还会适时地展现幽默风趣。


其次是听力理解能力,能够识别长段连续口语中隐含的重要概念和观点。 另外,团队也会给机器进行模拟一些困境,比如说通过独特的知识表达方式来模拟具有人类争议和困境的场景,使系统能够根据需要提出有原则的论点。


IBM Project Debater将首先适用于两大商用场景


Debater团队表示,在未来,Project Debater的核心技术可能会应用在金融顾问和律师等职业中。


金融分析师可以通过使用机器的优缺点分析技术,从而支持或反对金融分析师所思考的金融投资选择。而律师则通过 Project Debater 的汇总技术来寻找相关的案件和观点主张,以此了解相关内容与手头案件的关系,研究可在法庭上使用的较为合适的法律先例。


虽然从核心技术和商业模式来看,Debater的未来应用潜力较大。但我们需要注意的一大问题是,据悉,观众中的媒体记者和分析师认为,虽然整体来看,人类辩手表达更好,但是AI传递的信息量的丰富程度优于人类辩手。并且在上周的辩论过程中,AI系统确实也做出了一些“疯狂”的断言。


总而言之,IBM Project Debater是否能真正具备公认判断力并且落地商业化,不仅需要行业的真正实际应用认可,还需要更多AI相关技术的突破。IBM Project Debater作为IBM在AI领域的又一次尝试,开创了“计算辩论”(Computational Argumentation)的领域,其技术积累的经验可能会让IBM未来在全新的人机交互界面和“B To B”商业项目拓展上,拥有了更多可能性。


(腾讯科技李海丹)


(编辑:王星


版权所有

本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。文中图片除非有标注外,均来源于网络。如若发现有侵犯您知识产权的作品,请与我们取得联系,我们会及时修改或删除。邮箱:qygcbs@163.com


返回顶部