史上首次!外媒:AI在多人撲克比賽中勝過人類
據(jù)埃菲社7月11日?qǐng)?bào)道,這是當(dāng)前唯一一個(gè)在多人比賽中表現(xiàn)勝過人類撲克選手的AI系統(tǒng)。在此之前,在撲克比賽中擊敗人類是少數(shù)AI未能完成的挑戰(zhàn)之一。
報(bào)道稱,對(duì)于AI系統(tǒng)而言,撲克具有諸如國(guó)際象棋等其他游戲不具備的難點(diǎn),那就是“信息不對(duì)稱”:由于桌面上的一些牌始終背面朝上,玩家只能了解游戲進(jìn)程的一部分。因此,想要獲勝就必須理解和猜測(cè)其他玩家的行為,這其中包括辨別對(duì)手什么時(shí)候是在虛張聲勢(shì)以及自己通過虛張聲勢(shì)的做法欺騙對(duì)手。
在實(shí)驗(yàn)中,該研究報(bào)告作者圖奧馬斯·桑德霍爾姆和諾姆·布朗采用“行動(dòng)抽象”和“信息抽象”技術(shù),減少AI在一局游戲中需要考慮的行動(dòng)。
據(jù)他們介紹,強(qiáng)化學(xué)習(xí)系統(tǒng)和新算法的結(jié)合是機(jī)器能夠戰(zhàn)勝人類的關(guān)鍵。這款由他們與臉書共同研發(fā)的名為“Pluribus”的AI系統(tǒng),在一次又一次與自身副本的對(duì)抗中學(xué)會(huì)了如何在六人制無限制德州撲克比賽中獲勝。
在與副本進(jìn)行游戲的過程中,該AI系統(tǒng)生成了一套既定策略,科學(xué)家們稱之為“行動(dòng)計(jì)劃”。而在與真實(shí)的對(duì)手比賽時(shí),Pluribus會(huì)通過尋找其他對(duì)于應(yīng)對(duì)當(dāng)局游戲而言更有效的即時(shí)行動(dòng)來改進(jìn)這套既定策略。
事實(shí)上,Pluribus的算法做出的一些反饋甚至讓它的開發(fā)者感到驚訝。大多數(shù)職業(yè)撲克選手會(huì)避免一種明顯不合邏輯的下注方式(在術(shù)語(yǔ)中被稱作“驢式下注”),其唯一的目的是擾亂在游戲中居主導(dǎo)地位的玩家。然而,Pluribus會(huì)相對(duì)頻繁地使用這種下注方式。被它擊敗的職業(yè)選手之一達(dá)倫·伊萊亞斯說:“AI最強(qiáng)的地方在于它運(yùn)用混合策略的能力。我們?nèi)祟愡x手也想做同樣的事,但我們?cè)趫?zhí)行上存在問題。以完全隨機(jī)的方式持續(xù)進(jìn)行這種操作非常難。”
桑德霍爾姆指出,在此之前,在戰(zhàn)略思維方面超越人類的AI所取得的重大成就僅限于二人對(duì)決,但在如此復(fù)雜的游戲中擊敗5名玩家的能力為利用AI解決現(xiàn)實(shí)世界中各種各樣的問題提供了新機(jī)會(huì)。
網(wǎng)友評(píng)論
資訊排行
延伸閱讀
最新資訊
- 2024國(guó)際消費(fèi)電子上市公司企業(yè)家青島行活動(dòng)舉行
- OpenAI在紐約租下首個(gè)辦公室 科技行業(yè)助力辦公室
- 重磅!2024中國(guó)“冷暖智造”大獎(jiǎng)獲獎(jiǎng)名單揭曉
- 星紀(jì)魅族舉辦 AI 生態(tài)發(fā)布會(huì) 加速描繪全場(chǎng)景
- 華為舉辦秋季全場(chǎng)景新品發(fā)布會(huì),華為WATCH GT
- SENYUAN森源家具攜手COSMO CROSS,精彩亮相2024
- 北京市豐臺(tái)區(qū):將對(duì)無人機(jī)、eVTOL、飛行汽車整機(jī)
- 千商大會(huì)大咖觀點(diǎn):家居行業(yè)如何通過“三家一體”
- 石景山智算中心算力項(xiàng)目合作簽約,首批200P算力正
- 蘇寧易購(gòu)將于今晚8點(diǎn)全球同步開啟iPhone16預(yù)購(gòu)