python玩轉街機遊戲,操作親民!
這是一個允許你在幾乎任何街機遊戲中訓練你的強化學習演算法的Python庫,它目前在Linux系統上可用。透過這個工具包,你可以定製演算法逐步完成遊戲過程,同時接收每一幀的資料和內部儲存器地址值以跟蹤遊戲狀態,以及傳送與遊戲互動的動作。
跟大家推薦一下我的Python學習交流裙【 784758214 】內有安裝包和學習影片資料,零基礎,進階,,大牛線上解答疑問。希望可以幫助你快速瞭解Python、學習python
安裝
GitHub地址:github.com/M-J-Murray/MAMEToolkit/blob/master/README.md
你可以用pip安裝這個庫,只需執行以下命令:
pip install MAMEToolkit
演示:街霸
街霸是史上最經典的遊戲之一。現在工具包內包含的街霸版本是街頭霸王3:三度衝擊(Japan 990608, NO CD),我們以此為例,用以下程式碼寫一個隨機智慧體:
import randomfrom MAMEToolkit.sf_environment import Environment roms_path = "roms/"env = Environment("env1", roms_path) env.start()while True: move_action = random.randint(0, 8) attack_action = random.randint(0, 9) frames, reward, round_done, stage_done, game_done = env.step(move_action, attack_action) if game_done: env.new_game() elif stage_done: env.next_stage() elif round_done: env.next_round()
支援hogwild!
hogwild!? Niu等人引入了一個叫做 Hogwild! 的更新策略,可以使 SGD 可以在多 CPU 上並行更新。處理器在無需對引數加鎖的情況下就可以訪問共享記憶體。但僅在輸入的是稀疏資料時才有效,因為每次更新僅修改所有引數的一小部分。他們展示了在這種情況下,更新策略幾乎可以達到一個最優的收斂率,因為處理器不太可能覆蓋掉有用的資訊。
from threading import Threadimport randomfrom MAMEToolkit.sf_environment import Environment def run_env(env): env.start() while True: move_action = random.randint(0, 8) attack_action = random.randint(0, 9) frames, reward, round_done, stage_done, game_done = env.step(move_action, attack_action) if game_done: env.new_game() elif stage_done: env.next_stage() elif round_done: env.next_round() def main(): workers = 8 # Environments must be created outside of the threads roms_path = "roms/" envs = [Environment(f"env{i}", roms_path) for i in range(workers)] threads = [Thread(target=run_env, args=(envs[i], )) for i in range(workers)] [thread.start() for thread in threads]
建立自己的遊戲環境
這個工具包之所以易於上手,是因為它和模擬器本身不需要太多互動,只需注意兩點——一是查詢你關注的內部狀態相關聯的記憶體地址值,二是用選取的環境跟蹤狀態。你可以用MAME Cheat Debugger,它會反饋遊戲的記憶體地址值如何隨時間變化。如果要建立遊戲模擬,你得先獲得正在模擬的遊戲的ROM,並知道MAME使用的遊戲ID,比如街霸的ID是'sfiii3n'。
遊戲ID
你可以透過執行以下程式碼找到遊戲的ID
from MAMEToolkit.emulator import Emulator emulator = Emulator("env1", "", "", memory_addresses)
這個命令會開啟MAME模擬器。你可以搜尋遊戲列表以找到想要的遊戲,遊戲的ID位於遊戲標題末尾的括號中。
記憶體地址
如果獲得了ID,也有了想要跟蹤的記憶體地址,你可以開始模擬:
from MAMEToolkit.emulator import Emulatorfrom MAMEToolkit.emulator import Address roms_path = "roms/"game_id = "sfiii3n"memory_addresses = { "fighting": Address('0x0200EE44', 'u8'), "winsP1": Address('0x02011383', 'u8'), "winsP2": Address('0x02011385', 'u8'), "healthP1": Address('0x02068D0B', 's8'), "healthP2": Address('0x020691A3', 's8') } emulator = Emulator("env1", roms_path, "sfiii3n", memory_addresses)
這會啟動模擬器,並在工具包連線到模擬器程式時暫停。
分步執行模擬器
連線工具箱後,你可以分步執行模擬器:
data = emulator.step([]) frame = data["frame"] is_fighting = data["fighting"] player1_wins = data["winsP1"] player2_wins = data["winsP2"] player1_health = data["healthP1"] player2_health = data["healthP2"]
step函式會把幀資料作為NumPy矩陣返回,同時,它也會返回該時間步長的所有記憶體地址整數值。
如果要向模擬器輸入動作,你還需要確定遊戲支援的輸入埠和欄位。比如玩街霸需要先投幣,這個程式碼是:
from MAMEToolkit.emulator import Action insert_coin = Action(':INPUTS', 'Coin 1') data = emulator.step([insert_coin])
要確定哪些埠可用,請使用list actions命令:
from MAMEToolkit.emulator import list_actions roms_path = "roms/"game_id = "sfiii3n"print(list_actions(roms_path, game_id))
下面這個返回的列表就包含街霸環境中可用於向步驟函式傳送動作的所有埠和欄位:
[ {'port': ':scsi:1:cdrom:SCSI_ID', 'field': 'SCSI ID'}, {'port': ':INPUTS', 'field': 'P2 Jab Punch'}, {'port': ':INPUTS', 'field': 'P1 Left'}, {'port': ':INPUTS', 'field': 'P2 Fierce Punch'}, {'port': ':INPUTS', 'field': 'P1 Down'}, {'port': ':INPUTS', 'field': 'P2 Down'}, {'port': ':INPUTS', 'field': 'P2 Roundhouse Kick'}, {'port': ':INPUTS', 'field': 'P2 Strong Punch'}, {'port': ':INPUTS', 'field': 'P1 Strong Punch'}, {'port': ':INPUTS', 'field': '2 Players Start'}, {'port': ':INPUTS', 'field': 'Coin 1'}, {'port': ':INPUTS', 'field': '1 Player Start'}, {'port': ':INPUTS', 'field': 'P2 Right'}, {'port': ':INPUTS', 'field': 'Service 1'}, {'port': ':INPUTS', 'field': 'Coin 2'}, {'port': ':INPUTS', 'field': 'P1 Jab Punch'}, {'port': ':INPUTS', 'field': 'P2 Up'}, {'port': ':INPUTS', 'field': 'P1 Up'}, {'port': ':INPUTS', 'field': 'P1 Right'}, {'port': ':INPUTS', 'field': 'Service Mode'}, {'port': ':INPUTS', 'field': 'P1 Fierce Punch'}, {'port': ':INPUTS', 'field': 'P2 Left'}, {'port': ':EXTRA', 'field': 'P2 Short Kick'}, {'port': ':EXTRA', 'field': 'P2 Forward Kick'}, {'port': ':EXTRA', 'field': 'P1 Forward Kick'}, {'port': ':EXTRA', 'field': 'P1 Roundhouse Kick'}, {'port': ':EXTRA', 'field': 'P1 Short Kick'} ]
模擬器類還有一個frame_ratio引數,可用於調整演算法所見的幀速率。預設情況下,MAME以每秒60幀的速度生成幀,如果你覺得這太多了,想把它改成每秒20幀,可以輸入以下程式碼:
from MAMEToolkit.emulator import Emulator emulator = Emulator(roms_path, game_id, memory_addresses, frame_ratio=3)
MAME效能基準測試
目前這個工具包的開發和測試已在8核AMD FX-8300 3.3GHz CPU以及3GB GeForce GTX 1060 GPU上完成。在使用單個隨機智慧體的情況下,街頭霸王環境可以以正常遊戲速度的600%+執行。而如果是用8個隨機智慧體進行hogwild!訓練,環境可以以正常遊戲速度的300%+執行。
ConvNet智慧體
為了確保工具包能夠訓練演算法,作者還設定了一個簡單的5層ConvNet,只需少量調整,你就可以用它進行測試。在街霸實驗中,這個演算法能夠成功學習到遊戲的一些簡單技巧,比如連擊(combo)和格擋(blocking)。街霸本身的遊戲機制是分成10個關卡(難度遞增),玩家在每個關卡都要迎戰不同的對手。剛開始的時候,這個智慧體平均只能打到第2關。但在經過2200次訓練後,它平均能打到第5關。
至於智慧體的學習率,它是用每一局智慧體所造成的淨傷害和所承受的傷害來計算的。
跟大家推薦一下我的Python學習交流群【 784758214 】內有安裝包和學習影片資料,零基礎,進階,,大牛線上解答疑問。希望可以幫助你快速瞭解Python、學習python
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69901074/viewspace-2284310/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Python玩轉PDF各種騷操作大全!Python
- Nielsen:90%的父親在父親節玩遊戲作為娛樂遊戲
- 5 款 Linux 街機遊戲Linux遊戲
- 輕鬆玩轉Python檔案操作:移動、刪除Python
- Python 玩轉 ExcelPythonExcel
- 遊戲考古史VOL.4:街機遊戲的衰落與自救(行業轉型篇)遊戲行業
- 玩轉SVN-檢出操作
- 玩轉京東支付(python)Python
- 遊戲邦:比較免費遊戲&街機遊戲的心理和遊戲機制遊戲
- 玩轉python字典與列表(上)Python
- 玩轉python字典與列表(中)Python
- 玩轉python字典與列表(下)Python
- 微課|玩轉Python輕鬆過二級(3.4節):集合操作與應用Python
- CAPCOM創社40年:街機遊戲時代的霸王遊戲
- 親自動手實現Python+pygame中國象棋遊戲PythonGAM遊戲
- 小米釋出紅米Pro售價提高 價格不在親民?
- 你可能不信 你玩的空戰街機機制只是一個BUG
- 玩轉 Python 3.5 的 await/asyncPythonAI
- 不只嚇壞親孃,還要宰羊祭天,玩脫了的重口遊戲營銷遊戲
- 街機放置類:全新超休閒遊戲型別的崛起遊戲型別
- 難忘街機時代,這家公司如何復活童年遊戲?遊戲
- 微信小遊戲首度亮相 ChinaJoy,助力開發者玩轉小遊戲遊戲
- 在debian Linux上玩 dos 遊戲(轉)Linux遊戲
- 國美Fenmmy Note評測:價效比高 親民實用之選
- iPhone 6 mini資訊曝光:4英寸螢幕 售價親民iPhone
- 實戰|教你用Python玩轉MysqlPythonMySql
- 用 Python 玩轉 GitHub 的貢獻板PythonGithub
- mac上超好玩的街機遊戲模擬器:OpenEmu中文版Mac遊戲
- Mac強烈推薦街機賽車遊戲:Agent Intercept 疾速特工 for macMac遊戲
- 親和圖的具體操作指南
- 遊戲開發者依然能從這7款經典街機遊戲中汲取經驗遊戲開發
- win10商店的遊戲怎麼離線遊玩_win10商店的遊戲離線遊玩操作方法Win10遊戲
- 20人團隊15億流水的奇酷工場親授:遊戲出海日本怎麼玩?遊戲
- 洞悉玩家心理,玩轉移動遊戲廣告素材遊戲
- 玩遊戲卡怎麼辦? 玩遊戲卡的原因遊戲
- 2019盤點:機器學習更親民,AI系統更精巧機器學習AI
- 地方政策取向被指令網約車漲價 價格最好不親民?
- Python 超簡單玩轉微信自動回覆Python