問題重述:
當我們使用天河機進行並行程式實驗的時候,都會使用到yhrun/srun命令。在超算環境下,yhrun 命令用來進行提交互動式作業,有螢幕輸出。但是容易受到網路波動影響導致斷網或者關閉視窗最終導致作業中斷。
思考:
為了,能夠更好地使用yhrun/srun 命令來進行提交作業。我們首先要保證的是保持ssh連線不受網路中斷影響導致當前視窗執行的程式中斷,從而導致實驗需要重新執行,浪費了時間和資源。如果你已經開始執行程式,可以看我之前寫的部落格《nohup 與 & 的區別》來及時挽回損失。如果你正準備要進行實驗,更好的方法是使用tmux 或者 screen 命令列軟體,來保持程式執行,還能多人之間共享螢幕。通過測試,天河機器使用的是redhat作業系統,並且系統內部已經安裝了screen 軟體。所以可以很方便使用。
當然 screen 和 tmux 的教程都可以使用 man 命令進行檢視和學習。
screen經常使用的命令:
screen – screen manager with VT100/ANSI terminal emulation
screen -S xuyaowen : 建立一個名為 xuyaowen 的session
screen -ls and -list : 展示當前使用者建立了多少 session
screen -d : 效果和 Ctrl-a d , 刪除一個 session
screen -r xuyaowen : 恢復一個 session
screen -x 恢復一個 已經被 attach 的session, 用來螢幕共享
-x Attach to a not detached screen session. (Multi display mode).
參考連結:
https://blog.csdn.net/zy_zhengyang/article/details/52385887
https://www.ibm.com/developerworks/cn/linux/l-cn-screen/
linux man page
轉載請註明出處。2018年05月10日