Python的編碼註釋# -*- coding:utf-8 -*-

工程師WWW發表於2017-04-24
如果要在python2的py檔案裡面寫中文,則必須要新增一行宣告檔案編碼的註釋,否則python2會預設使用ASCII編碼。

[python] view plain copy
  1. # -*- coding:utf-8 -*-  

問題就來了,為什麼要如此宣告?

首先請參考Python的PEP http://www.python.org/dev/peps/pep-0263/

概要如下

1.必須將編碼註釋放在第一行或者第二行

2.可選格式有

[python] view plain copy
  1. # coding=<encoding name>  

[python] view plain copy
  1. #!/usr/bin/python  
  2. # -*- coding: <encoding name> -*-  

[python] view plain copy
  1. #!/usr/bin/python  
  2. # vim: set fileencoding=<encoding name> :  

但是再往下看,發現其實只要註釋裡面有coding 和對應的編碼就可以了,例如

[python] view plain copy
  1. #!/usr/bin/python  
  2. # vim: set fileencoding=<encoding name> :  

所以搞了半天對最標準的做法也有點糊塗了。

後來想了想,看了下VIM中對python的語法高亮檔案,裡面把如下的正規表示式確定為編碼宣告

[plain] view plain copy
  1. \%^.*\n.\?#.*coding[:=]\s*[0-9A-Za-z-_.]\+.*$  

對於這個正則有些有點看不懂,但是大致如下必須有coding:[編碼]或者coding=[編碼]才行,這個應該可以視作為標準的宣告方式吧。

但是為什麼通常這種方式呢?

[python] view plain copy
  1. # -*- coding:utf-8 -*-  

答案在PEP-0263裡面有所提及,那就是Emacs等編輯器使用這種方式進行編碼宣告。

話說PEP裡面很多東西都是很值得參考的畢竟可以知道為什麼程式這樣設計。


相關參考

PEP-0263

http://www.python.org/dev/peps/pep-0263/

vim語法檔案編寫總結

http://www.cnblogs.com/kohpoll/archive/2012/08/04/2623483.html

# -*- coding: UTF-8 -*- 這是個註釋嗎?

http://bbs.chinaunix.NET/thread-590066-1-1.html

相關文章