网易首页 > 网易财经 > 正文

当人工智能拥有好奇心,结果可能没你想象的那么糟糕

0
分享至

(原标题:当人工智能拥有好奇心,结果可能没你想象的那么糟糕)

摘要: 如何平衡内部和外部的反馈,将是如何让人工智能好奇心发挥作用的最大问题。

好奇心,是人和人工智能最显著的差异之一。从我们睁开双眼看这个世界开始,我们就在努力的了解着周围的一切,我们了解世界的方式很多样;一开始是试图把所有东西放进嘴巴里,到后来我们走遍了这世界的每一个角落。

这也是生命中最美妙的东西,在满足好奇心的过程中,我们获得了快乐。人类了解一切,不是为了完成某一个目标,而仅仅是一种来自本能的冲动。

可人工智能所做的,只有根据既定目标进行学习、搜索和计算。扫地机器人会探索周围环境,可这不是因为好奇,而是为了建立房间中的SLAM以完成工作。这也是强人工智能不会出现的证据之一:人类自己都没弄明白“意识”为何会存在,更没法将“本能”加在人工智能头上。

不过在现有技术下,我们能否让人工智能做出类似好奇的行为呢?比如给予无意义的探索行为一些奖励,或者是把探索行为和完成工作相结合进行评分。

答案是可以。

好奇心帮助人工智能成为更棒的水管工

还记得我们第一次玩超级玛丽的时候吗?或许我们中很多人玩的都是小霸王学习机里的超级玛丽式英语学习软件。不管是什么,进入游戏的第一时间,我们通常都是试一试手柄上的每一个按键是做什么的,然后跳来跳去,尝试触碰游戏里的每一个小方块。这就是好奇心最基本的表现。

那么人工智能在玩超级玛丽时是怎样的呢?通常情况下是应用了增强学习算法,用正负反馈机制帮助人工智能快速通关。踩死一只乌龟,获得正向反馈,掉入悬崖,获得反向反馈。问题时,只要能够继续过关,人工智能很难学会新的动作,这也就造成了遇到新的关卡时,人工智能常常需要耗费很大力气才能通过。

在一篇关于人工智能好奇心的论文中提到,人工智能利用传统的增强学习方法训练,在超级玛丽的游戏过程中,人工智能卡在了游戏的30%处,因为人工智能需要越过一个坑,而想要越过那个坑,需要15到20个特定顺序的按键操作。由于在坠落进坑里时已经获得了反向反馈,人工智能常常在坑的位置止步不前。

上述论文的作者,来自UC Berkeley的研究团队提出了一种新的思路,为人工智能加入了内部好奇心构型。以自监督的方式,预测自身行动会造成何种结果,并将这种算法称作自监督预测算法。

当外部反馈减少时,内部好奇心构型会激励人工智能通过探索环境去检验自我对于行动的预测。结果是,采取内部好奇心构型的人工智能不会盲目重复那些有正向反馈的动作,而是开始了解游戏环境,把握整体游戏进程。最终战胜了那个坑。

好奇心不仅会害死猫,还会让人工智能得“多动症”

接下来,在DeepMind计算机科学家Hester和德州大学奥斯汀分校的Peter Stone的研究中,同样的概念被进一步的具象化。

在强化学习的基础上,他们开发了一种名为TEXPLORE-VANIR的算法。和自监督预测算法不同的是,TEXPLORE-VANIR为人工智能设立了内部奖励机制,当人工智能探索环境时,即使这种行为对达到最终目标没有好处,人工智能也会因为减少了外部环境的未知性而获得来自内部的正向反馈。同时,在探索环境中发现了新事物时,人工智能也会获得正向反馈。

这么听起来,是不是很人类的好奇心非常相像了?

并且TEXPLORE-VANIR也让人工智能的好奇心不再止步于游戏中。在关于机器人工作的实验中,面临多项工作安排,TEXPLORE-VANIR算法能让机器人表现更好。原因是面临多项工作时,普通深度学习算法会让机器人不断重复某一项工作中的动作,因为机器人曾经在完成这一项工作时获得过正向反馈,当其他工作出现时,它还是会重复那些让自己获得过正向反馈的动作。这样一来,就会浪费很多时间。

当人类表现出过度好奇时,会有怎样的结果?最常见的,注意力无法集中,常常将手头的工作半途而废。同样,人工智能拥有好奇心后也会有同样的表现。搭载TEXPLORE-VANIR算法的机器人在一项给门开锁的任务上表现较差,就是常常因为好奇而去探索环境,导致任务完成的延迟。甚至有学者称,这是人工智能的“多动症”。

这样看来,如何平衡内部和外部的反馈将是如何让人工智能好奇心发挥作用的最大问题。

没有好奇心的人工智能只是机器?

我们更关心的是,让人工智能拥有好奇心这件事究竟有什么用?是为了他们在游戏中更好的打败我们?还是让他们在执行任务时分心而变得低效?或者说让他们更接近人类,可以更好的打败我们?

(电影超能查派中的人工智能自己研发出了如何转移意识,超越了电影中人类现有的科技水平)

首先,好奇心会让人工智能在学习时更加高效。减少对外部环境反馈的依赖,意味着对已有数据的利用率更高。比如在机械手臂试图抓起物品时,常常是把可能抓起物品姿势都尝试一遍,直到把物品抓起来。对于人来说,这是根本不能接受的低效,可换到了一个充着电的机器上,似乎就没人在意了。可笑的是,人工智能本应该替人类完成重复劳作的工作,结果却是用更多的人工智能重复劳作,代替人类的重复劳作。可有了好奇心,人工智能可以先对环境、环境中的物体进行初步的了解,然后再加以行动,而不是无脑的用暴力穷举解决问题。

其次,好奇心可以让人工智能更好的适应现实应用环境,毕竟现实和游戏或者实验不一样,没人会为人工智能的每个动作打分。当缺少外部环境反馈时,好奇心驱使的内部反馈就可以发挥很大作用。只有可以自我驱动的AI,才能在真正意义上帮助到人类,发现那些我们在设立目标时没有发现的事,而不是像所有机器一样根据指令行动。

看到这里,是不是加重了对人工智能的恐惧?别担心,大多数有关好奇心的算法目前还都停留在实验阶段,一是上文提过的,由于无法平衡内部反馈和外部反馈,好奇心常常会降低人工智能的工作效率。毕竟100%的专注,是所有机器的优势。第二则是,传统深度学习的“萝卜加大棒”政策已经能满足当下很多人工智能的应用。暴力穷举虽然低效,但是十分有效。

但我们相信,不管以何种形式,未来的人工智能一定会出现类似好奇心的机制,在更了解这个世界的前提下,更好的服务人类。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

相关推荐
热点推荐
很多地方把“为人民服务”变成“为大局服务”,这两者有啥区别?

很多地方把“为人民服务”变成“为大局服务”,这两者有啥区别?

翻开历史和现实
2024-04-25 13:12:17
102岁杨振宁庆祝“瓷婚”,翁帆母亲罕露面!墙上百万名画很抢眼

102岁杨振宁庆祝“瓷婚”,翁帆母亲罕露面!墙上百万名画很抢眼

娱乐团长
2024-04-18 21:00:03
河北人肉煎饼案谷宝成被执行死刑,行刑前哭着抽完2根烟

河北人肉煎饼案谷宝成被执行死刑,行刑前哭着抽完2根烟

青丝人生
2024-04-07 19:08:37
央视公布转播计划,广东男篮vs辽宁开球时间确定,球迷祝福。

央视公布转播计划,广东男篮vs辽宁开球时间确定,球迷祝福。

刺头体育
2024-04-26 12:08:47
曝石家庄对环卫工以灰尘重量为考核标准,1平米灰坐不超5g有奖励

曝石家庄对环卫工以灰尘重量为考核标准,1平米灰坐不超5g有奖励

可达鸭面面观
2024-04-26 22:45:47
再见林高远,再见陈幸同,国乒公布冠军杯参赛名单,两大主力落选

再见林高远,再见陈幸同,国乒公布冠军杯参赛名单,两大主力落选

极度说球
2024-04-27 00:55:12
掘金主帅更衣室演讲:虽然3比0领先,但还有很多地方需要改进

掘金主帅更衣室演讲:虽然3比0领先,但还有很多地方需要改进

懂球帝
2024-04-26 19:16:22
1990年,利比里亚总统多伊浑身赤裸地瘫坐在地上,他的十指被砍掉

1990年,利比里亚总统多伊浑身赤裸地瘫坐在地上,他的十指被砍掉

回京历史梦
2024-04-23 16:52:51
太惨了!中国女游客,不顾导游劝阻拍照,掉入硫酸湖中不幸身亡

太惨了!中国女游客,不顾导游劝阻拍照,掉入硫酸湖中不幸身亡

鬼谷子思维
2024-04-26 15:34:45
跌破60%大关!美国一季度GDP突破7万亿美元,对标中国优势变大了

跌破60%大关!美国一季度GDP突破7万亿美元,对标中国优势变大了

南生观察室
2024-04-26 00:07:08
清凉峰女子和驴友细节曝光,在一起3天2夜,圈内人:大概率绿了

清凉峰女子和驴友细节曝光,在一起3天2夜,圈内人:大概率绿了

苏大强专栏
2024-04-26 16:15:19
上门按摩师:假装盲人后,富家母女在我面前展现鲜为人知的一面

上门按摩师:假装盲人后,富家母女在我面前展现鲜为人知的一面

茶馆说书人
2023-09-08 11:46:14
“一箭双星”宣告失败,点火8分钟后偏离轨道,24.5亿打水漂!

“一箭双星”宣告失败,点火8分钟后偏离轨道,24.5亿打水漂!

星辰故事屋
2024-03-08 21:12:51
网友们只用了五个证据,就让纪云浩左右为难了

网友们只用了五个证据,就让纪云浩左右为难了

清晖有墨
2024-04-26 13:47:23
越南一工厂因订单不足,给工人无薪放假,遭遇集体大罢工,许多女工表示:这是逼我们辞职

越南一工厂因订单不足,给工人无薪放假,遭遇集体大罢工,许多女工表示:这是逼我们辞职

越南语学习平台
2024-04-26 10:38:38
周鸿祎:试了库里南 才明白问界M9真是一千万以内最好SUV

周鸿祎:试了库里南 才明白问界M9真是一千万以内最好SUV

手机中国
2024-04-26 14:04:09
这内讧了?拉塞尔!直接不搭理啊

这内讧了?拉塞尔!直接不搭理啊

篮球大图
2024-04-26 15:46:52
1987年,我国派出五名特工追杀一名叛徒,引出一位幕后谍王……

1987年,我国派出五名特工追杀一名叛徒,引出一位幕后谍王……

极品小牛肉
2024-04-23 14:04:29
纳达尔“世代碰撞”燃爆马德里 商竣程赢下今年最“抓马”对决!

纳达尔“世代碰撞”燃爆马德里 商竣程赢下今年最“抓马”对决!

好动网球
2024-04-26 14:17:22
苹果手机输入“发现石油”会自动定位?记者实测:安卓也这样

苹果手机输入“发现石油”会自动定位?记者实测:安卓也这样

南方都市报
2024-04-25 08:08:16
2024-04-27 02:00:49

财经要闻

贾跃亭,真他娘是个人才

头条要闻

官方回应环卫工用电子秤测灰尘:正常作业达标有奖励

头条要闻

官方回应环卫工用电子秤测灰尘:正常作业达标有奖励

体育要闻

还得等!记者:恩昆库本周尝试参加训练 但又被退回医疗中心

娱乐要闻

金靖回应不官宣恋情结婚的原因

科技要闻

车展观察|德系日系绝不能放弃中国市场

汽车要闻

2024北京车展 比亚迪的自驱力让对手紧追猛赶

态度原创

手机
健康
教育
艺术
军事航空

手机要闻

小米澎湃OS再次公布进展通报:处理新问题,且优化小米14耗电问题

这2种水果可降低高血压死亡风险

教育要闻

湖南中考因式分解题,给你10秒想思路,做起来就容易了

艺术要闻

画廊周北京迎来第八年, “漂留” 主题聚集 30 余家艺术机构与 40 场展览

军事要闻

以军称已完成对拉法地面军事行动准备工作

无障碍浏览 进入关怀版
×