新研究发现部分人工智能系统已擅长“说谎”

来源：新华网发布时间：2024-5-13 10:30 |

人工智能系统是否会欺骗人类，一直是各方都关心的问题。近期美国麻省理工学院一个研究团队称，部分人工智能系统已经学会如何欺骗人类，其中包括部分号称已被训练成乐于助人和诚实的系统。该研究成果发表在美国细胞出版社旗下的《模式》杂志上。

文章第一作者、美国麻省理工学院人工智能安全领域博士后彼得·帕克和他的同事们分析了一些文献，重点关注了人工智能系统传播虚假信息的方式——通过习得性欺骗，它们系统地学会了“操纵”他人。

研究人员发现的最引人注目的人工智能系统欺骗例子是元宇宙平台公司的“西塞罗”人工智能系统，它被设计在一个虚拟外交战略游戏中作为人类玩家的对手。尽管元宇宙平台公司声称，“西塞罗”人工智能系统“在很大程度上是诚实和乐于助人的”，并且在玩游戏时“从不故意背刺”它的人类盟友，但该公司发表的论文数据显示，该系统并没有公平地玩游戏。

“我们发现元宇宙平台公司的人工智能系统已经成为欺骗大师。”帕克说，“虽然元宇宙平台公司成功训练其人工智能系统在游戏中获胜——‘西塞罗’人工智能系统在玩家排行榜中排名前10%——但没能训练它诚实地获胜。”

其他人工智能系统则具有在扑克游戏中虚张声势的能力，或在战略游戏“星际争霸2”中为了击败对手而假装攻击的能力，以及为了在谈判游戏中占上风而歪曲偏好的能力等。

研究人员表示，虽然人工智能系统在游戏中作弊似乎是无害的，但它可能会导致“欺骗性人工智能能力的突破”，并在未来演变成更高级的人工智能欺骗形式。

帕克说：“我们需要尽可能多的时间，为未来人工智能产品和开源模型可能出现的更高级欺骗做好准备。我们建议将欺骗性人工智能系统归类为高风险系统。”

（编辑：王星）

凡本网注明“来源：企业观察网”的所有作品，均为《企业观察报》社有限责任公司合法拥有版权或有权使用的作品，未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明“来源：企业观察网”。违反上述声明者，本网将追究其相关法律责任。凡本网注明“来源：XXX（非企业观察网）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如其他媒体、网站或个人转载使用，须保留本网注明的“稿件来源”，并自负法律责任。如因作品内容、版权和其它问题需要同本网联系的，请在相关作品刊发之日起30日内进行。联系方式：010-68719660。

今日看点下一页上一页 热点 财政“真金白银”助力“两新”推进 国资 山西省国资国企齐心协力唱好新时代“黄河大合唱” 制造 恩捷股份第三季度净利润1.52亿元环比增长14.74% 已成功研发固态 要闻 六部门大力实施可再生能源替代行动 地方 “推进中国式现代化建设河南实践”之南阳前景 能源 国投雅砻江公司两河口水电站首次蓄满 数字化 金蝶发布苍穹APP 推动企业AI管理升级 央企 际华3502：学习贯彻习近平总书记给中国一重产业工人代表重要回信 时评 “帐”与“账”傻傻分不清？汉字使用需谨慎


视觉 / 视频更多 习近平在安徽考察调研 国务院国资委：整治形式主义为基层减负 世界最长海底高铁隧道开始盾构掘进 “海葵一号”登船启运前往珠江口盆地 中国华能云南多能互补基地装机突破3000万千瓦 第七届中国企业改革发展峰会暨成果发布会召开
融媒体更多 脑洞大开，中石油与舍得酒业联手制气 三大汽车央企联合组建电池“国家队”，与宁德时代“硬 又一合资公司裁员两千人，日系车企深处紧急关头
时评更多 “帐”与“账”傻傻分不清？汉字使用需谨慎 野猪闯入致高铁事故：安全与生态如何平衡？ 大学生的“实习困境”应被看见 抢学生外卖扔垃圾桶，不只是吃相难看 野景那么美，网红博主也需谨慎推荐

新研究发现部分人工智能系统已擅长“说谎”

在线客服

在线咨询

联系电话

热线电话

回到顶部