博弈論是如何用於遊戲中的策略設計的?

遊資網發表於2020-02-13
博弈論是如何用於遊戲中的策略設計的?

任何遊戲都有策略因素,而策略在遊戲中的重要程度會根據遊戲型別的不同也有所不同。

具體的遊戲型別中的策略偏好和比重在這裡不做過多說明,只稍微提一下:可以預見的是《爐石傳說》這類TCG遊戲及《文明》這樣的模擬經營遊戲中,策略是佔到絕對比重的;但也不要認為MOBA、射擊遊戲甚至是格鬥遊戲中策略就很弱了,《任天堂全明星大亂鬥》中,擊飛值替代了血量的設定及不強調搓招而是強調防禦、投技、重擊和輕擊構成了另外一個層面的石頭剪刀布,使得大亂鬥作為格鬥遊戲同樣有著豐富的策略性。而在考慮到玩家的操作和反應之後,其將會變得更為有趣。

博弈論本身是經濟學的一個分支,但是不要認為經濟學的東西只能用於MMO中的經濟系統的構建,而博弈論最為有趣的地方在於將人們的行為和目的量化成數學模型並以數學的方式分析。

博弈論本身是一門很深入的學科(很多經濟學家也靠博弈論的研究獲得過諾貝爾獎),所以我這裡只是簡單的思考一下如何將博弈論用於遊戲中的策略設計。

我將會從以下幾點去試著從博弈論的角度去分析遊戲中的策略設計:

  • 策略型別有幾種?
  • 一個好的遊戲中策略應該是怎麼樣的?
  • 玩家行為會對策略產生哪些影響?


1.策略型別有幾種?

(1)嚴格優勢策略

理論上策略是指所有參與者可以採取的行為,但是有些行為明顯是沒有意義的,舉個例子,在石頭剪刀布中,如果你知道對手會出剪刀,那麼你的策略就是出石頭,剪刀和布就不應該是你的策略。

在博弈論中,出石頭對付剪刀的策略叫做嚴格優勢策略。即採取該策略嚴格要比其他所有可採取的策略收益都要高。

博弈論是如何用於遊戲中的策略設計的?

石頭剪刀布的策略收益

這張圖可能很多人看過,很多國內的遊戲公司的筆試題就有有關這張收益圖的題目,一般是石頭剪刀布的策略收益配上另外一張不均衡的策略收益,之後會問你兩種型別有什麼區別之類的。

圖中,橫排和豎排表示兩名參與者的策略,ABC表示三種不同的策略,中間第一個收益表示橫軸參與者的收益,如果1則表示收益為1,0和-1同理。第二個收益就表示縱軸參與者的受益了。

所以這張圖就很好理解了,(1,-1)表示這個策略中,橫軸參與者的策略是優勢策略,縱軸是劣勢策略,也就是所謂的參與者1的策略剋制參與者2。

嚴格優勢策略在遊戲中的運用是很多的(手遊中應該是最多的),因為直觀好理解,也是最為簡單的,常見的就是卡牌遊戲中的屬性/陣營剋制,SLG中的兵種剋制,大佬們應該用的比我好,就不多說了。

嚴謹的嚴格優勢策略收益應該如下:

博弈論是如何用於遊戲中的策略設計的?

即兩名參與者的策略都是:不論在任何情況下嚴格選擇B,因為選擇策略B的收益總是要比選擇策略A要高。這其實也是著名的囚徒困境的收益圖,感興趣的同學可以自行多瞭解一下,這裡就不過多解釋了。

(2)隨機混合策略

隨機混合策略還是可以用石頭剪刀布來舉例子,我們只需要改掉一點就行了:即嚴格優勢策略中,我們知道對手的策略,但在隨機混合策略中,我們不知道對手確切的策略

博弈論是如何用於遊戲中的策略設計的?

還是看石頭剪刀布的收益圖,,如果我們不知道對手的收益,而對手的策略是完全隨機從ABC中選擇一個策略的話,那麼我們的策略也是隨機的在ABC中選擇一個策略,且我們每種策略的選擇概率是1/3。

我們的策略不是確定的某個策略,而是混合的幾個策略的概率集合。

舉例子的話,就類似網球比賽中正反手球的選擇,或者是足球比賽中點球的選擇。射手有可能踢左邊或者右邊,但因為點球往往速度很快,守門員需要隨機選擇一方提前撲救。當然實際情況中影響雙方的策略因素會更多,不過如果考慮理想情況就是如此。

(3)弱優勢策略

弱優勢策略是指我們並不能達成最大的策略優勢,往往是因為最大優勢的策略並非納什均衡策略,所以會在相對弱勢一些的策略中達成納什均衡,可以看下方這個例子。

博弈論是如何用於遊戲中的策略設計的?

在這個例子中,左上方四個格子的收益其實就是上面已經說過的囚徒困境中的收益圖。但是我們會發現:儘管看起來雙方都選擇策略A能達到更高(2,2)的收益,要高於雙方都選C(1,1)的收益,但是因為雙方都選擇A並非納什均衡:選擇如果已知對方選A,那麼我選擇B收益更高,所以最後雙方會達成都選C(1,1)的納什均衡,因為這樣的收益要高於雙方都選B,而且也是處於納什均衡中。

這個策略模型會要複雜許多,一般我們會在一些強調策略(手遊中很少有真正強調策略的遊戲)或者我們認為比較好玩的遊戲中看到這類策略模型,比如前面舉到的大亂斗的例子,最後大家都傾向於使用平A或空A,或者是MOBA中,理論上我們直接推對方基地是最快取得勝利的方式,但是出於大家都懂的各種要素,最後會形成三路佔線的模式,而且分路的形式也變得逐漸固定,這就是玩家們在遊戲的過程中逐漸摸索出來、大家都認可的策略模式,但這並非嚴格優勢策略,而是相對優勢策略,或者叫弱優勢策略。

2.一個好的遊戲中策略應該是怎麼樣的?

什麼是好的遊戲很難說得清楚,但是我相信所有人都會認可一點:好的遊戲應該是易上手難精通的。

不論是曾經被人吹爆,在國內有巨大人氣的暴雪(可惜是曾經了),還是前幾年在引爆了全球手遊市場的supercell,亦或是遊戲界的新寵吃雞,他們都可以說有易上手而難精通的特點。

易上手難精通的遊戲除了策略性還有操作和數值因素在裡面,其他兩者和三者間的平衡也很重要,不過這裡僅就策略性去聊,如何打造一個易上手但難精通的遊戲?

(1)如何讓遊戲易上手?

我們已經知道了三種策略型別,那麼哪一種策略型別是最為簡單的,很顯而易見:嚴格優勢策略

在MOBA中,我們都很快就會知道,高等級裝備好的英雄在面對低等級裝備差的英雄的時候是有著絕對優勢的,在面對敵方英雄的追擊的時候,躲進防禦塔也是最好的策略——防禦塔會攻擊敵方玩家,在我方防禦塔下隊友也可以更快速和方便的進行支援。

皇室戰爭也是如此:新手期往往我們都很快會發現防守優勢,從而更加傾向於採用防守反擊的策略。而爐石稍有不同(因為爐石是一個進攻有利的遊戲),但我們也很快會明白:費用更高的怪物和法術更加厲害,而取得勝利的最好辦法也是通過隨從站場取勝。吃雞我們也很快也會明白:裝備很重要、以及吃毒是嚴格劣勢策略。

上面舉的都是一些對抗遊戲,但其實在PVE為主的遊戲中你也可以發現這些遊戲有著這樣的策略設計,比如上個月剛上國內市場就取得了亮眼成績的莉莉絲的劍與遠征就有著很明確的陣營剋制關係和同陣營陣容加成,很明確的就告訴了玩家你需要去湊同一陣營的陣容。並且如果有注意到的話,前期小額付費和活躍贈送的英雄都是光耀帝國的英雄,而應該是在第4-6大關中,敵人都恰好是被光耀帝國剋制的蠻血部落陣營的英雄,對應小R及免費玩家的首周遊戲時間,進一步強化了策略驗證。

而劍與遠征的原型,放置奇兵,不但沒有同陣營陣容加成,關卡設計也沒有劍與遠征這麼細節,所以被劍與遠征後來居上也是有原因的。

博弈論是如何用於遊戲中的策略設計的?

從博弈論的角度來看,如果這是一個石頭剪刀布的遊戲,那麼嚴格優勢策略應該是這樣的:

博弈論是如何用於遊戲中的策略設計的?

石頭是橫排玩家的嚴格優勢策略,可以理解為橫排玩家養成過石頭這個策略,如果只考慮玩家自己的收益,橫排玩家出石頭的策略收益嚴格優於其他策略。不過如果按照該收益,實際情況中橫排玩家並不會一直出石頭,最終的納什均衡是兩名玩家的收益均等,我們後面會詳細講。

除了清晰直接之外,嚴格也是很重要的:如果你希望策略A嚴格比策略B要好,那麼不能採取曖昧的策略設計。比如陣營剋制其實就挺曖昧的,因為玩家並不確定敵人究竟會是哪一個陣營的,剋制了對手固然很爽,但也會擔憂是否需要準備多套陣容。

除此之外,另外一種情況也有可能,比如我們有如下兩種技能設計:

博弈論是如何用於遊戲中的策略設計的?

理論上來說劍雨是要強於斬殺的,因為雖然是AOE,但敵人只要數量超過兩名那麼收益一定比斬殺高,還將附帶額外的燃燒效果。

但是必須要注意,玩家並不會去計算收益,這也是為什麼很多遊戲會給技能等級和戰鬥力,因為這樣才能直觀的告訴玩家哪個技能更強,哪個技能更弱,但也很有可能玩家會因為得到了錯誤的資訊而做出錯誤的判斷(戰鬥力高不一定更強)。

而且對技能的一些包裝也可能影響玩家的判斷,通過名字,玩家可能直觀的認為劍雨是AOE技能,而斬殺是斬殺技能;另外,技能也是附在角色身上的,角色本身的價值也將會影響玩家對技能的判斷。

博弈論是如何用於遊戲中的策略設計的?

這樣的兩個技能,誰強誰弱就一目瞭然了,這也才是真正意義上的嚴格優勢策略。

讓玩家快速的掌握遊戲的核心規則是很重要的,為此我們加入了嚴格優勢策略,玩家可以很快的瞭解到這個遊戲的一些基本規則,並且能快速的使用這種規則取得優勢,這是十分重要的,這也是易上手的精華所在。

(2)如何讓遊戲難精通?

除了嚴格優勢策略,弱優勢策略和隨機混合策略都可以為遊戲帶來難於精通的點:弱優勢策略帶來的是策略的深度,而隨機混合策略則是一定的隨機性。

如果用MOBA舉例子,弱優勢策略類似於雙方都沒有把握的時候都不會發起進攻或是互換資源,而隨即混合策略則是類似於走位躲技能和試圖命中的博弈;而用吃雞舉例子的話,弱優勢策略就是沒有把握的時候大家都傾向於卡在圈邊,決賽圈尤其如此,而隨機混合策略就是選擇打資源多但人也多的區域,還是選擇在資源少但人也少的地方苟活。

這裡特別說明一下,刷圈和刷的裝備不是隨機混合策略,因為玩家不會在其中選擇策略,對毒圈的反應和根據裝備選擇的打法才是策略。

這兩個策略不像前面嚴格優勢策略那麼一目瞭然,遊戲和遊戲之間差距也會比較大,但是我們仍然可以用石頭剪刀布來舉例子,我們先假設這個遊戲會進行很多輪,最後比較雙方的得分,那麼這時候石頭已經並非橫排玩家的嚴格優勢策略了——因為豎排玩家只要一直出布就行了,這時候橫排玩家的收益不是0而是-1了。

博弈論是如何用於遊戲中的策略設計的?

我們把橫排玩家的收益改成上圖,那麼因為實際遊戲中反饋並非及時的,最終橫排玩家出石頭的概率首先會變大,但接著因為豎排玩家出布則出剪刀,然後因為豎排玩家出石頭而改為出布,達到一個均衡狀態之後兩人的策略仍然是隨機混合狀態,而遊戲的最終均衡狀態是兩名玩家的收益相等。

因為我們是在一個隨機混合策略中加入了嚴格優勢策略,從而導致了嚴格優勢策略變成了非納什均衡策略——因為你的對手也知道你的石頭更強,他們會想辦法通過策略去抹平甚至是取得優勢。

因而我們可以看到,在加入多輪博弈之後,策略也會因此變得更加豐富起來,前面所說的兩名玩家進行多輪改良版石頭剪刀布之後,策略就較原先變得豐富了許多。

但是隨即混合策略的問題在於隨機性比較強,玩家不一定能夠對策略有很好的認知,而且贏了之後有可能會認為是運氣使然(當然好處也是輸了也可以認為是對方運氣較好)。所以我更加傾向於在遊戲中設置更多的弱優勢策略

在原來的基礎上我們可以更加進一步改進策略,比如我們給豎排玩家一個技能:如果你出布,你不會輸,你的對手不會贏。那麼,布是豎排玩家的弱優勢策略——如果你的對手出了剪刀,則你出石頭的收益更高,而同理如果你的對手出了剪刀,那麼你應該出石頭。但因為你出布總是不虧甚至是賺的,所以最終出布成為了這個博弈中,純策略納什均衡中,豎排玩家的弱優勢策略(這裡有點繞,但總之出布就對了)。

博弈論是如何用於遊戲中的策略設計的?

看起來似乎擁有這個技能的豎排玩家太無敵了,遊戲變得不公平了,那我們可以沿用之前的思路,將遊戲改成總共進行三輪,而這個技能只能使用一次,這樣一來布就不是均衡的弱優勢策略了,豎排玩家也可以放棄這個技能帶來的優勢,單純採取心理戰。

弱優勢策略很難像嚴格優勢策略那樣去說明,因為嚴格優勢策略基本就是策劃設計的,而弱優勢策略往往是玩家之間的博弈了,所以有人會問了,怎麼去合理的設計這種玩家之間的博弈呢?

我將從下面這一點去說明。

(3)貫續博弈和行為樹

前面已經看到了,除了嚴格優勢策略外,即使是隻在石頭剪刀布這樣簡單的遊戲中加入一點變化,整個博弈都變得複雜了起來。單純的給玩家複雜的策略對體驗並沒有好處,玩家期待的是亂中有序,能夠感受到自己很牛逼,這樣的遊戲才是有趣和快樂的,這一點其實宮崎老賊的魂系列遊戲中體現的尤為淋漓盡致:魂like的精髓就是,看似很難,實則不難

但是這樣的遊戲往往很難設計:如果設計需要的策略太多,不要說玩家,可能連開發者自己都搞不清了,而太少或者是太簡單了,就很容易玩穿了,所以一個常見的辦法是設計貫續博弈。

所謂的貫續博弈用人話說就叫回合制。

嗯……話是這麼說,但不要小看回合制,尤其是在如今手遊的時代,玩家的遊戲體驗和時間都變得越來越碎片化,像模擬城市那樣大塊且整體的去思考是很難的,玩家很有可能失敗幾次之後也就換遊戲了。

其實近幾年的趨勢都是在做減法,但減法並非去掉遊戲內容(當然有的時候也會去掉),更多的時候是把資訊或玩法條理的收納起來,讓玩家層層遞進的去摸索和體驗,而非一開始就把所有內容都鋪在玩家面前。

現在的很多遊戲已經在這麼做了,最明顯的就是玩法和功能會隨著玩家的遊戲程式而逐漸解鎖。但很多遊戲沒有做到的一點就是,玩法和系統並非成一個整體,而是彼此獨立,系統和系統之間沒有環環相扣,沒有產生1+1>2的效果,不過這裡也不展開說明了。

而回合制,也就是所謂的貫續博弈,其實也就是給玩家很多次博弈,比如在吃雞中,一開始毒圈很大,玩家可以在任意一個地區搜刮裝備,碰到的敵人數量也有限,隨著毒圈的縮小,玩家也逐漸進行策略的選擇,儘管部分其他玩家這時候被淘汰了,但其實玩家密度卻慢慢在變高,也就是說玩家需要考慮的決策也變多了。

另外一個要素就是玩家的資訊也在逐漸變多,這也會導致玩家需要決策的地方變多。MOBA也是如此,DOTA中的關鍵裝備,LOL中的關鍵技能,中立的關鍵資源(因為一開始玩家並動不了大龍或者肉山),都是隨著遊戲的程式慢慢浮現出來,這也就導致玩家的策略也在慢慢變多。

但是需要注意的是,如果把握得當,你可以使得整個遊戲的策略性十分豐富,但是仍然必須要注意,在單輪博弈中不能給玩家太多選項,否則就過猶不及了。

而所謂的行為樹,其實也就是分析貫續博弈中所有可能策略的圖形,如果我們設計了一個貫續博弈,也可以用它來指導我們的設計。

博弈論是如何用於遊戲中的策略設計的?

這是一個最簡單的貫續博弈,首先是A選擇上方或者下方的策略,然後是B選擇,分析的方法叫逆向分析法,即從最後一個子博弈看,上圖中,如果有第二輪博弈,B會選擇下方的策略,而因為B會選擇下方的策略,所以A會選擇下方的弱優勢策略,因為2>0。

這樣說可能稍微有點抽象,我們可以套入一個現有的情景,比如LOL中,你打贏了一波團,對方僅剩2人的情況下:

博弈論是如何用於遊戲中的策略設計的?

該圖說明,帶線牽制對A來說收益都是固定的,但因為對方是打大龍還是推高地,B的收益有所不同。而B的兩個上方策略(搶大龍和守高地)會因為一些情況而有所不同,所以其實是存在兩個概率。

對於搶大龍:B大概率(0.8)會失敗,此時收益是(7,-2),不但丟了大龍還要再犧牲一人;但有小概率(0.2)會成功,此時收益是(-5,10),對方不但錯失推高的時機,還丟了大龍。下面的守高地則同理。

這裡因為加入了概率事件,就不存在確定的策略了,是要選擇捨命一搏還是穩穩地拿下大龍,都是有策略抉擇在裡面的。但我們通過逆向分析法可以知道,期望來說打大龍的收益是要比一波要高的,所以玩家會傾向於選擇團滅對手之後打大龍。

但是這裡要注意兩個地方,第一,打大龍的收益要比推高地要高玩家才會選擇大龍這個策略,否則如果這是一個至少相對劣勢的策略,那麼很有可能就變成一個無效策略了(所以LOL經常被人吐槽可以玩的英雄太少);第二,遊戲設計者的思路不一定是玩家最終策略,比如有些策略設計者並不一定想到了,但是實際發揮出來很厲害,那麼就出現了設計不可控的現象了。

從頭到尾的設計也許會比較困難,但是從尾到頭其實反而沒那麼難。有一個經典的博弈論模型是飢餓的獅子,感興趣的同學可以去搜一搜。對於遊戲策略的設計,其實跟行為樹一樣,我們可以先設計大體的框架和期望的方向,然後從尾巴開始(勝利條件),反推玩家每一步的博弈和整個遊戲過程,這樣或許可以更好的確保我們遊戲的策略性。

說了這麼多,總算是就著博弈論如何用於遊戲策略簡單的聊了聊。但其實影響遊戲樂趣和策略性的東西還很多,舉個例子:玩家就是其中重要的一環。如果蓋亞理論,生命會極大的影響我們生存的環境,玩家也會改變遊戲的生態。

玩傢俱體是怎麼影響生態和策略的,可以看下這篇文章。作者深入淺出地從對抗遊戲平衡性講到了玩家如何影響遊戲平衡。

好了,照慣例最後來總結一下:

對於一款策略性豐富的遊戲,我們希望是易上手而難精通的,要達成易上手我們要有一定的很明確的嚴格優勢策略;而為了讓遊戲難精通,我們又要有一定的隨機性和弱優勢均衡策略。這三者的平衡要把握好,其中隨機性不宜太強,其他二者則考慮自己的目標使用者吧。最後是我們不希望為難使用者,所以我們儘量採用多輪依次貫續博弈的形式去鋪開策略,讓使用者單次面臨可以接受的策略選擇。而設計策略的方法,我們可以從結果去反推,借鑑博弈論中行為樹的形式去逆向設計。

以前看一本關於互動設計的書的時候,有兩個觀點很有意思,第一是為中級使用者而設計,第二是把使用者想成很忙但是很聰明的人

現在太多的遊戲為初級和小白使用者去設計了,刻意的去把遊戲簡化成失去了遊戲本來的樂趣。其實我還挺認同這兩點的:只有為中級使用者去設計,使用者才能找遊戲(或者只是一款應用)中找到價值和成就感;而把使用者當成很忙但是很聰明的人則意味著,不要擔心使用者學不學得會,去擔心能不能在幫他省時間的前提下,給他創造價值。


作者:雲飛
專欄地址:https://zhuanlan.zhihu.com/p/104775323

相關文章