Daemon場景
考慮如下場景:你編寫了一個python服務程式,並且在命令列下啟動,而你的命令列會話又被終端所控制,python服務成了終端程式的一個子程式。因此如果你關閉了終端,這個命令列程式也會隨之關閉。
要使你的python服務不受終端影響而常駐系統,就需要將它變成守護程式。
守護程式就是Daemon程式,是一種在系統後臺執行的程式,它獨立於控制終端並且執行一些週期任務或觸發事件,通常被命名為"d"字母結尾,如常見的httpd、syslogd、systemd和dockerd等。
程式碼實現
python可以很簡潔地實現守護程式,下面給出程式碼和相應註釋。這份程式碼穩定執行在我本地電腦的一個守護程式(自制鬧鐘)裡,暫時沒出過問題。
# coding=utf8 import os import sys import atexit def daemonize(pid_file=None): """ 建立守護程式 :param pid_file: 儲存程式id的檔案 :return: """ # 從父程式fork一個子程式出來 pid = os.fork() # 子程式的pid一定為0,父程式大於0 if pid: # 退出父程式,sys.exit()方法比os._exit()方法會多執行一些重新整理緩衝工作 sys.exit(0) # 子程式預設繼承父程式的工作目錄,最好是變更到根目錄,否則回影響檔案系統的解除安裝 os.chdir('/') # 子程式預設繼承父程式的umask(檔案許可權掩碼),重設為0(完全控制),以免影響程式讀寫檔案 os.umask(0) # 讓子程式成為新的會話組長和程式組長 os.setsid() # 注意了,這裡是第2次fork,也就是子程式的子程式,我們把它叫為孫子程式 _pid = os.fork() if _pid: # 退出子程式 sys.exit(0) # 此時,孫子程式已經是守護程式了,接下來重定向標準輸入、輸出、錯誤的描述符(是重定向而不是關閉, 這樣可以避免程式在 print 的時候出錯) # 重新整理緩衝區先,小心使得萬年船 sys.stdout.flush() sys.stderr.flush() # dup2函式原子化地關閉和複製檔案描述符,重定向到/dev/nul,即丟棄所有輸入輸出 with open('/dev/null') as read_null, open('/dev/null', 'w') as write_null: os.dup2(read_null.fileno(), sys.stdin.fileno()) os.dup2(write_null.fileno(), sys.stdout.fileno()) os.dup2(write_null.fileno(), sys.stderr.fileno()) # 寫入pid檔案 if pid_file: with open(pid_file, 'w+') as f: f.write(str(os.getpid())) # 註冊退出函式,程式異常退出時移除pid檔案 atexit.register(os.remove, pid_file)
概括一下守護程式的編寫步驟:
1、fork出子程式,退出父程式
2、子程式變更工作目錄(chdir)、檔案許可權掩碼(umask)、程式組和會話組(setsid)
3、子程式fork孫子程式,退出子程式
4、孫子程式重新整理緩衝,重定向標準輸入/輸出/錯誤(一般到/dev/null,意即丟棄)
5、(可選)pid寫入檔案
理解幾個要點
為什麼要fork兩次
第一次fork,是為了脫離終端控制的魔爪。父程式之所以退出,是因為終端敲擊鍵盤、或者關閉時給它傳送了訊號;而fork出來的子程式,在父程式自殺後成為孤兒程式,進而被作業系統的init程式接管,因此脫離終端控制。
所以其實,第二次fork並不是必須的(很多開源專案裡的程式碼就沒有fork兩次)。只不過出於謹慎考慮,防止程式再次開啟一個控制終端。因為子程式現在是會話組長了(對話期的首次程式),有能力開啟控制終端,再fork一次,孫子程式就不能開啟控制終端了。
檔案描述符
Linux是“一切皆檔案”,檔案描述符是核心為已開啟的檔案所建立的索引,通常是非負整數。程式透過檔案描述符執行IO操作。
每個程式有自己的檔案描述符表,因此相同的描述符可能指向同一個檔案,也可能指向不同檔案;來自不同程式的不同的描述符,當然也有可能指向同一個檔案。
預設情況下,0代表標準輸入,1代表標準輸出,2代表標準錯誤。
umask許可權掩碼
我們知道,在Linux中,任何一個檔案都有讀(read)、寫(write)和執行(execute)的三種使用許可權。其中,讀的許可權用數字4代表,寫許可權是2,執行許可權是1。命令ls -l可以檢視檔案許可權,r/w/x分別表示具有讀/寫/執行許可權。
任何檔案,也都有使用者(User),使用者組(Group),其他組(Others)三種身份許可權。一般用3個數字表示檔案許可權,例如754:
7,是User許可權,即檔案擁有者許可權
5,是Group許可權,擁有者所在使用者組的組員所具有的許可權
4,是Others許可權,即其他組使用者的許可權啦
而umask是為了控制預設許可權,防止新建檔案或資料夾具有全權。
系統一般預設為022(使用命令umask檢視),表示預設建立檔案的許可權是644,資料夾是755。你應該可以看出它們的規律,就是檔案許可權和umask的相加結果為666(笑),資料夾許可權和umask的相加結果為777。
程式組
每個程式都屬於一個程式組(PG,Process Group),程式組可以包含多個程式。
程式組有一個程式組長(Leader),程式組長的ID(PID, Process ID)就作為整個程式組的ID(PGID,Process Groupd ID)。
會話組
登陸終端時,就會創造一個會話,多個程式組可以包含在一個會話中。而建立會話的程式,就是會話組長。
已經是會話組長的程式,不可以再呼叫setsid()方法建立會話。因此,上面程式碼中,子程式可以呼叫setsid(),而父程式不能,因為它本身就是會話組長。
另外,sh(Bourne Shell)不支援會話機制,因為會話機制需要shell支援工作控制(Job Control)。
守護程式與後臺程式
透過&符號,可以把命令放到後臺執行。它與守護程式是不同的:
1、守護程式與終端無關,是被init程式收養的孤兒程式;而後臺程式的父程式是終端,仍然可以在終端列印
2、守護程式在關閉終端時依然堅挺;而後臺程式會隨使用者退出而停止,除非加上nohup
3、守護程式改變了會話、程式組、工作目錄和檔案描述符,後臺程式直接繼承父程式(shell)的
換句話說:守護程式就是默默地奮鬥打拼的有為青年,而後臺程式是默默繼承老爸資產的富二代。