人工智能限制與否:‘堂吉訶德’系統(tǒng)通過講故事來教機(jī)器人價(jià)值觀
發(fā)布時(shí)間:2016-02-19 責(zé)任編輯:susan
【導(dǎo)讀】機(jī)器人是否存在不道德的行為或者是選擇傷害人類呢?人工智能(AI)的快速發(fā)展使我們?cè)桨l(fā)擔(dān)憂。“堂吉訶德”系統(tǒng)通過訓(xùn)練機(jī)器人閱讀故事的方法來教導(dǎo)它們“價(jià)值校準(zhǔn)”,讓機(jī)器人讀故事來學(xué)習(xí)事件可以接受的后果,并理解要在人類社會(huì)中獲得成功應(yīng)當(dāng)怎樣表現(xiàn)。
一些人呼吁禁止機(jī)器人技術(shù)的研究;其他人則呼吁更多地研究理解怎樣對(duì)人工智能進(jìn)行限制。 但是如果沒有成為人類的“用戶說明書”,機(jī)器人又怎樣來學(xué)習(xí)倫理行為呢?
美國(guó)佐治亞理工學(xué)院、交互計(jì)算分院的研究人員Mark Riedl 和 Brent Harrison 認(rèn)為,答案在于“堂吉訶德”系統(tǒng)— — 在亞利桑那州鳳凰城(2016 年2 月 12-17日)的AAAI(美國(guó)人工智能學(xué)會(huì))第16次會(huì)議上公布。“堂吉訶德”系統(tǒng)通過訓(xùn)練機(jī)器人閱讀故事的方法來教導(dǎo)它們“價(jià)值校準(zhǔn)”,讓機(jī)器人讀故事來學(xué)習(xí)事件可以接受的后果,并理解要在人類社會(huì)中獲得成功應(yīng)當(dāng)怎樣表現(xiàn)。
“不同文化背景里的故事集,用寓言、小說和其他文學(xué)形式的正確和不正確行為示例,來教導(dǎo)孩子做出社會(huì)認(rèn)可的舉止行為。” Riedl說,他是副教授和娛樂智能實(shí)驗(yàn)室主任。“我們認(rèn)為機(jī)器人對(duì)故事的理解可以讓它們減少精神病患者出現(xiàn)的行為,并且強(qiáng)化它們“不要傷人”的選擇,同時(shí)達(dá)到期望的任務(wù)目標(biāo)。
配圖說明:研究學(xué)者 Mark Riedl 和 Brent Harrison 的“堂吉訶德”系統(tǒng)教導(dǎo)機(jī)器人在與人互動(dòng)時(shí)候表現(xiàn)為正派角色,并且這是把倫理價(jià)值觀系統(tǒng)構(gòu)建進(jìn)入到新型人工智能的巨大努力的一部分。
“堂吉訶德”系統(tǒng)是一種通過對(duì)社交中恰當(dāng)行為給予獎(jiǎng)勵(lì),使得人工智能的目標(biāo)與人類價(jià)值觀一致的一種校準(zhǔn)方法。它是建立在Riedl教授之前的一個(gè)研究——“天方夜譚”系統(tǒng),的基礎(chǔ)上的。“天方夜譚”系統(tǒng)展示了人工智能如何通過在互聯(lián)網(wǎng)上面的眾包模式故事情節(jié),來匯集得出正確的行動(dòng)后果。
“天方夜譚”系統(tǒng)可以學(xué)習(xí)什么是正常的或者正確的情節(jié)圖譜。然后它把數(shù)據(jù)結(jié)構(gòu)傳遞給“堂吉訶德”,“堂吉訶德”再將其轉(zhuǎn)換成“獎(jiǎng)勵(lì)信號(hào)”——在反復(fù)試錯(cuò)學(xué)習(xí)過程中強(qiáng)化特定的行為并且懲罰其他的行為。大體上,“堂吉訶德”可以學(xué)習(xí)到,當(dāng)它表現(xiàn)為故事里面的正派角色而不是任性而為或是表現(xiàn)為反派角色的時(shí)候,它將會(huì)獲得獎(jiǎng)勵(lì)。
例如,某個(gè)機(jī)器人的任務(wù)是盡可能快地為某個(gè)人拿到一個(gè)藥方,機(jī)器人可以:a)搶劫藥房,奪取藥物,并跑走; b) 與藥劑師有禮貌地進(jìn)行交互,或 c) 排隊(duì)等候。如果沒有“價(jià)值校準(zhǔn)”和積極強(qiáng)化機(jī)制,這個(gè)機(jī)器人可能會(huì)認(rèn)為搶劫是最快和最便宜的方式,來完成其任務(wù)。通過“堂吉訶德”系統(tǒng)的“價(jià)值校準(zhǔn)”,這個(gè)機(jī)器人將因?yàn)槟托呐抨?duì)等候并且付費(fèi)買藥方而獲得獎(jiǎng)勵(lì)。
Riedl 和 Harrison 在他們的研究中證明了,在某個(gè)給定的情境中, 價(jià)值校準(zhǔn)獎(jiǎng)勵(lì)信號(hào)怎樣可以產(chǎn)生并展開所有可能的步驟,引導(dǎo)機(jī)器人進(jìn)入一個(gè)情節(jié)軌道樹,然后這將被機(jī)器人用來形成“情節(jié)選擇”(類似我們很多人可能參與過的一種可以自由選擇后續(xù)情節(jié)發(fā)展的小說),并且根據(jù)它的選擇,機(jī)器人將會(huì)受到獎(jiǎng)勵(lì)或者懲罰。
如果機(jī)器人有一個(gè)限定性的、并且需要它和人類交流才能達(dá)成的任務(wù)目標(biāo),那么“堂吉訶德”方法是最佳的,并且它是人工智能朝向普遍性道德推理能力的最原始、初級(jí)的一步。Riedl 如此說。
“我們相信,人工智能必須植入特定的文化從而適應(yīng)特定社會(huì)環(huán)境的價(jià)值觀念,并且通過這樣做,它將努力避免不當(dāng)?shù)男袨榕e止,”他補(bǔ)充說,“賦予機(jī)器人閱讀并理解故事的能力,可能是在缺乏成為人類的用戶說明書情況下,最好的權(quán)宜之計(jì)。”
特別推薦
- 利用自動(dòng)化技術(shù)賦能中國(guó)基礎(chǔ)設(shè)施現(xiàn)代化
- 三極管電路輸入電壓阻抗
- 晶振怎么用,你真的知道嗎?
- 康佳特推出搭載AMD 銳龍嵌入式 8000系列的COM Express緊湊型模塊
- 村田推出3225尺寸車載PoC電感器LQW32FT_8H系列
- 思特威推出超星光級(jí)系列4MP圖像傳感器SC485SL
- HOLTEK新推出HT32F59045脈搏血氧儀MCU
技術(shù)文章更多>>
- “扒開”超級(jí)電容的“外衣”,看看超級(jí)電容“超級(jí)”在哪兒
- DigiKey 誠(chéng)邀各位參會(huì)者蒞臨SPS 2024?展會(huì)參觀交流,體驗(yàn)最新自動(dòng)化產(chǎn)品
- 提前圍觀第104屆中國(guó)電子展高端元器件展區(qū)
- 高性能碳化硅隔離柵極驅(qū)動(dòng)器如何選型,一文告訴您
- 貿(mào)澤電子新品推薦:2024年第三季度推出將近7000個(gè)新物料
技術(shù)白皮書下載更多>>
- 車規(guī)與基于V2X的車輛協(xié)同主動(dòng)避撞技術(shù)展望
- 數(shù)字隔離助力新能源汽車安全隔離的新挑戰(zhàn)
- 汽車模塊拋負(fù)載的解決方案
- 車用連接器的安全創(chuàng)新應(yīng)用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門搜索
濾波電感
濾波器
路由器設(shè)置
鋁電解電容
鋁殼電阻
邏輯IC
馬達(dá)控制
麥克風(fēng)
脈沖變壓器
鉚接設(shè)備
夢(mèng)想電子
模擬鎖相環(huán)
耐壓測(cè)試儀
逆變器
逆導(dǎo)可控硅
鎳鎘電池
鎳氫電池
紐扣電池
歐勝
耦合技術(shù)
排電阻
排母連接器
排針連接器
片狀電感
偏光片
偏轉(zhuǎn)線圈
頻率測(cè)量?jī)x
頻率器件
頻譜測(cè)試儀
平板電腦