如何debug一個perl程式
--5.6版本或更高，
#!/user/bin/perl –w
Use warnings;--此時會報告編譯錯誤，但不會終止程式執行
Use diagnostics;--檢視更詳細的診斷說明，但程式會啟動很慢(向記憶體中載入警告和詳細說明)

$ perl –M diagnostics ./my_program—避免每次都載入記憶體，比較方便，直接顯示錯誤資訊

單引號與雙引號的區別
單引號—除了單引號和反斜線字元，所有字元都代表自己；標示反斜線字元本身，需要在其前面再加一個反斜線；
‘hello world\n’—輸出hello world\n
'hello'\\n'—會報錯Backslash found where operator expected at test.pl line 1, near "'hello'\"
print 'hello\'\\n' –輸出hello'\n
雙引號
--\代表跳脫字元
“hello world\n”—輸出hello world，後面緊接換行符

如何連線字串
採用’.’--”hello ”.”world”等同於”hello world”
“justin” X 3—等同於”justinjustinjustin”

獲取使用者輸入
--，獲取使用者行輸入，會等待
$line = ;
If ($line eq “\n”) –使用者輸入換行符，

Chomp
--去除行尾的換行符
Chomp($text = )等同於 $text =; chomp($text);

Qw
--建立字串列表，不必輸入引號；
Qw( fred barney betty dino )也可以qw< a b c >或qw# qa qb qc #
($a[0], $a[1], $a[2], $a[3]) = qw/a b c d/;
@a = qw/ a b c d /;

POP/PUSH運算子
@array = 5..9;
$a = pop(@array);--@array為(5,6,7,8)，$a為9
Pop @array;--@array現在是(5,6,7)
Push(@array,0)--@array現在是(5,6,0)

Shift/unshift運算子
@a = qw# dino fred barney #;
$m = shift(@a);--$m為dino，@a為(“fred”,”barney”)
Unshift(@a, ‘asd’);--@a現在為(“asd”,”fred”,”barney”)

字串陣列內插
@a = qw( a b c);
$email = “fred@a.edu”—則會內插@a陣列
應寫為
$email = “fred\@a.edu”或者$email = ‘fred@a.edu’;

Foreach控制結構
@rocks = qw/ bed slate lava /;
Foreach $rock (@rocks) {
$rock = “\t$rock”;
$rock .= “\n”;
}
迴圈結束後，控制變數會恢復成迴圈執行之前的值

$_ “老地方” 預設變數
--當未告知perl使用哪個變數視，自動使用$_
Foreach (1..10) {
Print “ I can count to $_ \n”;
}

$_ = “Yahoo \n”;
Print;--預設列印$_

Reverse
--讀取列表的值，並按相反的次序返回該列表
@a = 6..10;
@a = reverse @a;-- 此時a的值10,9,8,7.6
Reverse @a;-- 語法錯誤

Sort
--讀取列表的值，並且根據內部的字元編碼的順序，進行排序；對ASCII編碼的字串，則按ASCII碼排序
@rocks = qw/ a b c d /;
@rocks = sort @rocks; --排序後為a b c d

標量上下文/列表上下文
--列表上下文產生元素的列表；標量上下文則會返回陣列中元素的個數
@a = qw( d z a );
@b = sort @a;--列表上下文a,d,z
$n = 42 + @a;--標量上下文：42 + 3，得45
@backward = reverse qw / a d c/--變成a,c,d
$backward = reverse qw / a d c/--變成cda，標量上下文
$fred = somethind;--列表上下文
($fred) = somethind;--標量上下文

清空陣列
@betty = ( );
@betty = undef;--得到一個列表，且僅有一個元素；清空失敗

強制指定標量上下文
--在列表上下文的地方，強制引入標量上下文，可以使用偽函式scalar
@rocks = qw( a b c d );
Print “ I have “, @rocks,” rocks \n”;--輸出各種石頭的名稱
Print “ I have “, scalar @rocks, “ rocks \n”;--輸出石頭的數量

列表上下文中的
--標量上下文中返回輸入資料的下一行；列表上下文中返回所有剩下的行，直到檔案結尾，從鍵盤輸入的按control-D標示檔案結尾；
@lines = ;--列表上下文讀取標準輸入
Chomp(@lines);--
Chomp(@lines = );--讀入所有行，且去除換行符

一次讀入的是400M的日誌檔案，perl會全部讀入，會佔用至少1G的記憶體，因為perl通常浪費記憶體來節省時間；

子程式
--使用sub定義，可以在程式的任何地方
--可以在任意表示式中使用子程式名，用&呼叫
--子程式最後一次運算的結果會被自動當成返回值
$n = &max(10.15);
引數列表被傳入子程式，陣列變數為@_，在子程式執行期間有效；子程式的第一個引數儲存於$_[0]，第二個為$_[1];
--私有變數
Sub max {
My($m,$n);--私有變數
($m,$n) = @_;
If ($m > $n) {$m} else {$n}
}
--限制長度可變的引數列表
Sub max{
If (@_ != 2) {
Print “ &max should get exactly 2 arguments \n”;
}
}
--更好的&max子程式
--採用high-water mark演算法
$maximum = &max(3,5,10,6,4);
Sub max {
My($max_so_far) = shift @_;--將陣列中的第一個值，暫時當做最大值
Foreach (@_) {--遍歷陣列中的其他元素
If ($_ > $max_so_far) {
$max_so_far = $_;
}
}
$max_so_far;
}
非標量返回值，可以返回列表值
--想取出某段範圍的數字
Sub list_from_fred_to_barney {
If ($fred < $barney) {
$fred..$barney;
} else {
#從$fred倒數回$barney
Reverse $barney..$fred;
}
}
$fred = 11;
$barney = 6;
@c = &list_from_fred_to_barney;--@c的值為(11,10,9,8,7,6)

持有性私有變數
--使用state宣告變數，子程式可以多次保留變數
--任意型別的變數都可以被宣告為state變數
Sub marine {
State $n = 0;
$n += 1;
Print “Hello, sailor number $n \n”
}

Running_sum(5,6);
Running_sum(1..3);
Sub running_sum {
State $sum = 0;
State @numbers;

Foreach my $number (@_) {
Push @numbers, $number;
$sum += $number;
}

Say “The sum of (@numbers) is $sum”;
}
輸出
The sum of (5,6) is 11;

標準輸入
--作為行輸入，讀取到檔案結尾，會返回undef，自然會跳出迴圈
--while (defined($line =)) { print “I saw $line”;};
鑽石運算子<>
--行輸入運算子特例，
--while (defined($line = <>)) { ….};
呼叫程式./my_program fred betty，則會依次讀入檔案fred/betty中的內容；切換檔案時候中間不會有間斷；
--<>的引數來自@ARGV陣列，由perl直譯器建立的，與普通陣列使用一樣；
--呼叫引數

標準輸出
Print @array;--一個接一個的列印出資料中元素，之間沒有空格
Print “@array”;--列印字串，以空格間隔
Print (2+3)*4;--輸出5；接著perl從print取得返回值1，再將它乘以4；

格式化輸出printf
%g—按需要自動選擇浮點數、整數或指數
%d—顯示整數，舍掉小數點
%s—字串；printf “%10s\n”, “Wilma”輸出     Wilma;
%%--輸出百分號；printf “%.2f%%”;輸出0.00%
輸出陣列
my @item = qw { justin abc dbc asdg };
printf "The itme are:\n".("%10s\n" x @item),@item;
輸出—括號中的@item是標量上下文，而後面的是列表上下文
The itme are:
     justin
       abc
       dbc
      asdg

檔案控制程式碼
--程式裡代表perl與外界之間I/O聯絡的名字，建議名字全部大寫
--6個保留名:STDIN、STDOUT、STDERR、DATA、ARGV、ARGVOUT
./my_program Wilma—程式的輸入檔案來自檔案dino，輸出到檔案wilma
Cat fred barney | sort | ./my_program | grep something |lpr
--將檔案fred和barney中的內容輸出並排序，然後輸入到perl程式，執行完再過濾出需要的結果併傳送到印表機列印

開啟檔案控制程式碼
Open CONFIG, “dino”;
Open CONFIG, “Open CONFIG, “>dino”;--開啟檔案並向其寫入資訊，寫之前清空原有資訊
Open CONFIG,”>>dino”;--開啟檔案並向其追加資訊
可以使用任何的標量表示式
My $file = “my_output”;
Open LOG, “> $file”;--中間有空格，避免檔名中出現’>’，導致>變成>>;
不正確的檔案控制程式碼
My $success = open LOG, “>>logfile”;
If (! $success){ ..open操作失敗}

用die處理嚴重錯誤
--當程式遭遇到嚴重錯誤時，die函式會輸出指定的資訊到標準錯誤流中，並讓程式立即終止，並返回不為0的退出碼；
If (! Open LOG, “>>logfile”) {
Die “Cannnot create logfile:$!”;--$!是可讀的系統出錯資訊
}

使用warn輸出警告資訊
--功能與die類似，但不會終止程式執行

改變預設的檔案輸出控制程式碼
--不顯示指定，預設輸出到STDOUT
Select BEDROCK;--接下來的print/printf將向BEDROCK控制程式碼中輸出資訊
--資料輸出到檔案控制程式碼時，預設都會經過緩衝處理；$| = 1；#立即重新整理緩衝區

複用標準檔案控制程式碼
--開啟已經被開啟過的檔案控制程式碼，包括6個標準檔案控制程式碼
--open STDERR, “>> /home/oracle/.error_log”

Say
--等同於print，但行尾自動加上換行符
--輸出內插陣列，仍需要用引號括起來，否則陣列中的元素會連成字串
My @array = qw( a b c d);
Say @array;--輸出abcd\n
Say “@array”;--輸出a b c d\n

雜湊
--$hash($some_key)；賦值$family_name(“fred”) = “bac”; $file = $family_name(“fred”);不存在的值會得到undef;
--%訪問整個hash；
%some_hash = (“foo”,35,”bar”,2.5); 也可使用直觀的胖箭頭 my %last_name = ( “fred” => “flintstone”, “dino” => undef);
--賦值給陣列 @array = %some_hash；但是排列順序可能會變
--%new_hash = %old_hash；%inverse_hash = reverse %any_hash發轉hash

Keys/values函式
--my %hash =(“a” => 1,”b” => 2,”c”=> 3);
--my @k = keys %hash;--a,b,c
--my @v = values %hash;--1,2,3
--在標量上下文中，這兩個函式都會返回雜湊中鍵/值對的個數，計算過程不必對整個雜湊進行遍歷
My $count = keys %hash;--得到3

Each函式
--羅列雜湊的每個鍵/值對
While ( ($key,$value) = each %hash ) {
Print “$key => $value\n”;
}
--each返回鍵/值的順序是亂的，如果需要依次處理雜湊，對鍵排序
Foreach $key ( sort key %hash ) {
$value = $hash($key);
Print “$key => $value\n”;或者print “$key => $hash($key)\n”;
}

Exists函式
--檢查雜湊中是否有某個鍵
If ( exists $books(“justin”) ) {…..}

Delete函式
--從雜湊中刪除指定的鍵及其相對應的值
My $person = “justin”;
Delete $books($person);

%ENV雜湊
--雜湊獲取執行環境變數，存取%ENV雜湊
$ENV(PATH)

正規表示式 regular expresssion
簡易模式
$_ = “yabba dabba doo”;
If (/abba/) {…..} –表示式/abba/會在$_中尋找這4個字元組成的串，如果找到就返回真
/cake\tsprite/ --會匹配cake、一個製表符和sprite

元字元
--點號(.)配置任何單字元，換行(“\n”)除外
--反斜線(\)，在任何元字元前面加上反斜線，就會使他失去元字元的作用；要得到真正的反斜線，用兩個反斜線表示；/3\.1415926/得到3.1415926

簡易量詞
--星號(*)配置前面內容0次或多次的 /fred\t*barney/匹配fred和barney之間有任意多個製表符的串
--(.*)匹配任意字元無限多次，/red.*barney/
--(+)加號，匹配前一個條目一次以上:/fred +barney/
--(?)問號，前一個條目可以出現一次或不出現

模式分組
--()表示分組；/fred+/表示freddddd，/(fred)+/匹配fredfredfred
--反向引用；\1、\2，
$_ = “abba”;
If (/(.)\1/) {…}—圓括號中的點號匹配任何非回車字元，則同’bb’匹配
If(/y(….)d\1/) {..}—匹配y後面連續4個連續的非回車字元，並且用\1在d字元之後重複這4個字元
其中\n代表第n組括號，從左往右
$_ = "yabba";
if (/(.)(.)\2\1/) {
print "$_ matches\n";--匹配
}
$_ = “AA11BB”;
If(/(.)\111/) {…}; --此時搜尋第111個括號會失敗
If( /(.)\g{1}11/ ) {…};--搜尋第一個括號且後面跟上11

擇一匹配
--豎線(|)，左邊或右邊匹配都行；/fred|barney|betty/匹配任何含有fred或barney或betty的字串；
--/fred( |\t)+barney/匹配fred好barney之間空格、製表符或兩者組合出現一次以上的字串，加號表示重複一次或多次
--/fred( +|\t+)barney/，兩個單詞間一定全是空格或製表符

字符集
--寫在方括號[]中，只匹配單個字元，可以是字符集中列出的任何一個
--[a-zA-Z]匹配52個字母中的任何一個
--脫字元^，表示排除在外；[^n\-z]匹配n、-、z以外的任何字元,-前面加反斜線標誌轉義

字符集簡寫
--\d代表[0-9]；\w表示單寫字元[A-Za-z0-9]；
--\s相當於[\f\t\n\r ]，即換頁、製表、換行、回車以及空格，但只是匹配其中一個字元，可以寫成\s+匹配一個以上；
--\h匹配橫向空白，即[\t ]；\v匹配縱向空格，[\f\n\r]；\R匹配任何型別的斷行

反義簡寫
--\d、\w、\s的反義簡寫就是\D,\W.\S，也可寫成[^d],[^w],[\s]
--/[\dA-Fa0f]+/匹配16進位制數字
--[\d\D]表示任何數字或非數字，即匹配任何字元(而點號匹配換行符以外的任意字元)；[^\d\D]

以正規表示式進行匹配
以m//進行匹配
--//為其簡寫；/^http:\/\//匹配起始的http://，也可以寫成m%^http://%

/i進行大小寫無關的匹配
Chomp($_ = );
If (/yes/i)—大小寫無關的匹配

/s匹配任意字元
--點號無法匹配換行符，而/s可以完成這個任務；它將模式中的每個點號按[\d\D]處理
$_ = “I saw Barney\ndown at the bowling allay\n”;
If (/Barny.*fred/s)—

/x加入空白
--能夠在模式裡面隨意加上空白，更易閱讀；
--/-?\d+\.?\d*/可以改寫成/ -? \d+ \.? \d* /x，使原始的空白與製表符失去意義；如果還要匹配空白與製表符，就得在前面補上一個反斜線字元；

組合選項修飾符
--在一個模式中使用多個修飾符，可以連在一起使用，先後順序不會影響匹配的結果
If (/barney.*fred/is) {…}
同樣的模式加上註釋之後
If (m{
Barney#小夥子 barney
.*    #之間的任何東西
Fred #大嗓門的fred
}six) #同時使用/s,/i和/x

錨位
--預設情況，模式匹配的過程開始於待匹配字串的開頭，若不相符就一直往後推移；錨位可以讓模式直接匹配字串的某處
--脫字元^，表示字串開頭；美元符號$表示字串結尾；
--/^\s*$/用來匹配空白行，如果不加前後兩個錨位，則會把非空白行也一起算進去；

單詞錨位
--錨位不侷限於字串的首尾；\b匹配單詞邊界
--/\bfred\b/只能匹配fred，無法匹配frederick/alfred，此處的單詞指一連串的字母、數字與下劃線的組合，也就是匹配/\w+/模式的字元；
--非單詞邊界錨位是\B，能匹配所有\b不能匹配的位置；/\bsearch\B/會匹配searches、searching，但不匹配search、researching；

繫結運算子=~
--預設情況下模式匹配物件為$_，而=~能讓perl拿右邊的模式匹配左邊的字串，而非$_；
My $some_other = “I dream of betty rubble”;
If($some_other =~ /\brub/) {…}
也可以寫成如下方式：
Print “Do you like Perl?”;
My $like_perl = ( =~ /\byes\b/i);--判斷回答是否為yes，不區分大小寫
If ($like_perl) {…}

模式串中的內插
My $what = shift @ARGV;
While (<>) {
If (/^($what)/) {--定位於字串的開頭
--如果第一個命令列引數是fred|barney，則模式會變成/^(fred|barney)/，即在每一行開頭尋找fred或barney

捕獲變數
--一個圓括號代表一個變數，用$1、$2表示
--失敗的匹配模式不會改動上次成功匹配時捕獲的內容
$_ = “Hello there, neighbor”;
If (/(\S+) (\S+), (\S+)/) {
Print “$1 $2 $3”;--列印出Hello there neighbor
}
My $dino = “I fear that I’ll be extinct after 1000 years.”;
If($dino =~ /(\d*) years/) {…}
--不捕獲模式，允許使用括號但不作捕捉；書寫的時候需要在左括號的後面加上?:(問號和冒號)；
If (/(?:bronto)?saurus (steak|burger)/) {—不捕獲括號跳過bronto
Print “Fred wants a $1\n”;
}

命名捕捉
My $names = ‘Fred or Barney’;
If ( $names =~ m/(\w+) and (\w+)/ )—不會匹配
If ($names =~ m/(\w+) (and|or) (\w+)/)—可以匹配
Say “$1, $2”;--輸出Fred or，而Barney進入了$3
--而命名捕捉會把結果放進一個特殊的雜湊%+，其中的鍵就是在捕捉時候使用的特殊標籤，值就是被捕獲的串；
--為捕獲串加標籤，(?pattern)，其中label可以自行命名；捕獲時候使用$+{label}
If ( $names =~ m/(?\w+) (?:and|or) (?\w+)/ ) {
Say “I saw $+{name1} and $+{name2}”;
}

自動匹配變數
--$&自動捕獲當前變數，$`匹配起始位置之前的字串，$’匹配結束位置之後的字串；
If (“Hello there, neighbor” =~ /\s(w+),/) {
Print “That was ($`)($&)($’).\n”;--輸出(Hello) ( there,) (neighbor)
}

通用量詞
--如果*、+、?都不符合需要，可以在花括號{}裡指定重複次數
--/a{5,15}/匹配重複出現5到15次的a
--*等價於{0,}；+等價於{1,}；?等價於{0,1}

用正規表示式處理文字
用s///替換
$_ = “He’s out with Barney tonight.”;
s/Barney/fred/;--將Barney替換為fred;
替換字串可以用到捕獲變數
s/with (\w+)/against $1’s team/;--變為He’s out against fred’s team
$_ = “green scaly dinosaur”;
s/(\w+) (\w+)/$2, $1/;--替換後變為了scaly, green dinosaur

/g全域性替換
--s///只會進行一處替換
--常見的全域性替換是縮減空白
$_ = “Input data\t may     have whitespace.”;
s/\s+/ /g;--現在變為Input data may have whitespace.
--去除開頭和結尾的空白
s/^\s+//;--刪除開頭的空白字元
s/\s+$//;--刪除結尾的空白字元

不同的界定符
--s///可以採用不同的定界符
S#^
S
可選修飾符
S#wilma#Wilma#gi—將所有的wilma(不區分大小寫)一律替換成Wilma

大小寫轉換
--替換過程中，將單詞改為大寫或小寫；\U轉為大寫，\L轉為小寫；小寫的\u\l只會影響第一個字元
$_ = “I saw justin and ren”;
s/(justin|ren)/\U$1/gi;--變為I saw JUSTIN and REN
s/(justin|ren)/\u\L$1/ig;--變為I saw Justin and Ren

split運算子
--根據分隔符拆開一個字串；
--通常處理被製表符、冒號、空白或任意符號分割的字串
@fields = split /:/, “:::a:b:c:::”;--得到(””,””,””,”a”,”b”,”c”)
My $some_input = “This is a \t         test.\n”;
My @args = split /\s+/, $some_input;--得到”This”, “is”, “a”, “test.”
--split預設以空白字元分割$_
my @fileds = split;--等同於split /\s+/, $_;

join函式
--將子字串聯合稱為一個字串；可以把第一個引數理解為膠水，其餘引數則是一串片段；
My $result = join $glue, @pieces;--列表pieces至少要有兩個元素
My @values = split /:/, “4:6:8:10”;--@values為(4,6,8,10)
My $z = join “-“, @values;--$z為4-6-8-10

列表上下文中的m//
--使用m//時，如果模式匹配成功，則返回所有捕獲變數的列表；失敗則返回空列表；
--如果模式中有多對圓括號，則每次匹配能捕獲多個串，可把一個字串變成雜湊
My $data = “Barney Rubble Fred Justin”;
My %last_name = ($data =~ /(\w+)\s+(\w+)/g);--則構造出一對新雜湊的鍵/值對

非貪婪量詞
--貪婪量詞即保證整體匹配的前提下，儘量匹配長字串
--非貪婪量詞寫法+?、*?、??、{8,}?
I thought you said Fred and justin
去除的非貪婪用法
S#(.*?)#$1#g—I thought you said Fred and justin
而s#(.*)#$1#g則會變成I thought you said Fred and justin.

跨行的模式匹配
--/m，匹配串內的換行符
--把整個檔案讀進一個變數，然後把檔名置於每行的開頭：
Open FILE, $filename
Or die “Can’t open ‘$filename’: $!”;
My $lines = join ‘’, ;
$lines =~ s/^/$filename: /gm;

一次更新多個檔案
--備份原檔案，將修改過後的內容直接寫入新檔案；

控制結構
unless
--與if反義，當條件為假時執行

Until
--與while反義，一直迴圈執行直到條件為真

條件修飾詞
--為控制結構的簡化表達
Print “$n is a negative number.” If $n < 0;
$i *= 2 until $i > $j;

裸塊控制結構
--只執行一次
{
Body;
}

Foreach和for等價
For (1..10) {…}

迴圈控制
--perl有三個迴圈控制運算子
--Last等價於break；跳出當前迴圈
--Next等價於continue；立刻結束當前迭代，繼續執行下次迭代
--Redo將控制返回到本次迴圈的頂端，不會進入下次迴圈迭代
for (1..10) {
print "the $_ times\n";
print "Please choose: last, next, redo\n";
chomp(my $choice = );
#print "\n";
last if $choice =~ /last/i;
next if $choice =~ /next/i;
redo if $choice =~ /redo/i;
print "now we reach the end of the block\n";
}
執行輸出
the 1 times
Please choose: last, next, redo

now we reach the end of the block
the 2 times
Please choose: last, next, redo

now we reach the end of the block
the 3 times
Please choose: last, next, redo

now we reach the end of the block
the 4 times
Please choose: last, next, redo
next
the 5 times
Please choose: last, next, redo
redo
the 5 times
Please choose: last, next, redo
redo
the 5 times
Please choose: last, next, redo
last

帶標籤的塊
--極少出現，建議使用大寫
LINE: while (<>) {
For (split) {
   Last LINE if /__END__/;--跳出標籤為LINE的迴圈
   …
}
}

三目運算子?:
--同if-then-else同效，條件表示式?真表示式:假表示式；
My $size = ($width < 10) ? “small” :
         ($width < 20) ? “medium” :
         ($width <50) ? “large” : “extra-large”;

“定義否”運算子
--//，
For $try (0,undef,1,) {
My $value = $try//’default’;
Say “\tgot [$value]”;--列印出0,default,1,
}

Perl模組
僅選用模組中的部分函式
--模組中的函式和自定義的重名，use File::Basename qw / basename /，不引進任何函式則為use File::Basename qw//;
Use File::Basename qw//;--不匯入函式名稱
My $betty = &dirname($wilma);
My $dirname = File::Basename::dirname $name;--使用模組中的dirname函式

檔案測試
檔案測試運算子
--使用”-e”測試檔案是否存在
Die “file already exists.\n” if –e $filename;
Warn “Config file is pretty old!\n” if –M CONFIG > 28;--判斷檔案是否在過去28天裡變動過
--檢視系統中大於100kB且90天沒有被訪問過的檔案
Push @big_old_files, $filename
If –s $filename > 100_000 and –A $filename > 90;

同一個檔案的多項屬性測試
--每次執行檔案測試，perl都從檔案系統取出所有相關資訊(每次都在內部做一次stat操作)，比較耗費資源
--採用虛擬控制程式碼_避免重複勞動，告訴perl用上次查詢過的檔案資訊來做當前測試
If ( -r $file and –w _) --

棧式檔案測試操作
If ( -r –w –x –o –d $file)—判斷可讀、可寫、可執行、並隸屬當前使用者的目錄

Stat和Istat函式
--獲取沒有對應測試符的檔案屬性，如檔案擁有者的ID(uid)；執行失敗返回空列表或包含13個數字元素的列表；
My($dev,$ino,$mode,$nlink,$uid,$gid,$rdev,$size,$atime,$mtime,$ctime,$blksize,$blocks) = stat($filename);

Localtime函式
--列表上下文中，localtime返回一個數字元素組成的列表
My($sec,$min,$hour,$day,$mon,$year,$wday,$yday,$isdst) = localtime $timestamp;

目標操作
在目錄樹中移動
--程式執行時會以自己的工作目錄作為相對路徑的起點，使用chdir改變當前的工作目錄
Chdir “/etc” or die “cannot chdir to /etc: $!”;--發生錯誤時會設定標量變數$!的值

檔名通配
--使用glob運算子
My @all_files = glob “*”;--取得當前目錄中的所有檔案，並按字母順序排列
My @pm_flies = glob “*.pm”;
--使用尖括號(angle-bracket syntax)進行通配
My @all_files = --等同於@all_files = glob “*”

目錄控制程式碼
--從目錄裡取得檔名列表，-類似檔案控制程式碼，opendir/readdir/closedir
--返回的名稱列表未按任何特定的順序排列，只返回檔名，不包括路徑
My $dir_to_process = “/etc/”;
Opendir DH, $dir_to_process or die “cannot open $dir_to_process: $!”;
While ($name = readdir DH) {
Next unless $name =~ /\.pm$/;--查詢以.pm結尾的檔案
Next if $name =~ /^\./;--查詢不以點號開頭的檔案
…
}

遞迴的目錄列表
--使用File::Find

刪除檔案
--使用unlink刪除
Unlink glob “*.O”;--等價於rm *.O
My $successful = unlink “slate”,”bedrock”,”lava”;--返回刪除檔案的個數
--刪除檔案的許可權跟檔案本身的許可權位無關，取決於檔案所在目錄的許可權位

重新命名檔案
--rename “old”,”new”;
批次將.old結尾的檔案改為.new
Foreach my $file (glob “*.old”) {
My $newfile = $file
$newfile =~ s/\.old$/.new/;
If (-e $newfile) {
Warn “$newfile already exists.\n”;
} elsif( rename $file, $newfile) {
--改名成功
} else {
Warn “rename failed: $!\n”
}
}
迴圈裡的前兩行可以合併成
(my $newfile = $file) =~ s/\.old$/.new/;--宣告$newline並從$file裡取它的初始值，然後對$newfile進行替換；

連結與檔案
--取得符號連結指向的位置readlink
My $where = readlink “carroll”;

建立及刪除目錄
--oct函式，強行把字串當成八進位制數字處理
My $permissions = “0755”;
My $name = “fred”;
Mkdir $name, oct($permissions);
Rmdir $name;

修改許可權
Chmod 0755, “fred”, “barney”—返回成功更改的條目數量

更改隸屬關係
--使用chown，更改擁有者和所屬組，必須以數字形式指定；如果是字串則需要先用getgrnam轉換為數字
Defined(my $user = getpwnam “oracle”) or die “bad user”;
Defined(my $group = getgrnam “oinstall”) or die “bad group”;
Chown $user, $group, glob “/home/oracle/*”;

更改時間戳
--utime 訪問時間更改時間檔名列表
My $now = time;
My $ago = $now ? 24*60*60;--一天的秒數
Utime $now, $ago, glob “*”;--將最後訪問時間改為當前時間，修改時間改為前一天

字串與排序
字串內用index搜尋
--$where = index($big, $small);在$big字串裡尋找$small首次出現的地方，最開始的位置返回0
My $where2 = index($stuff, “w”, $where1 + 1);
--rindex搜尋子串最後出現的位置
My $last_slash = rindex(“/etc/passwd”,”/”);--值為4

Substr處理子串
--$part = substr($string,$initial_position,$length)

Sprintf格式化資料
--唯一與printf不同之處，返回處理過的字串，而不是列印出來

高階排序
--by_number { $a <=> $b} 等價於 { if ($a < $b) { -1 } elsif ($a > $b) {1} else {0} }
--飛碟運算子只能比較數值 <=>
--cmp可以比較字串，{$a cmp $b}；比較之前強制轉為小寫{“\L$a” cmp “\L$b”}

My @numbers = sort { $a <=> $b } @some_numbers;--遞增排序
My @numbers = reverse sort { $a <=> $b } @some_numbers;--遞減排序

雜湊按值排序

智慧匹配
智慧匹配運算子~~
--類似=~，但更智慧
--在雜湊%names中查詢任何匹配Fred的鍵
Foreach my $key (keys %names) {
Next unless $key =~ /Fred/;
$flag = $key;
Last;
}
可以改寫成
Say “I found a key matching ‘Fred’” if %names ~~ /Fred/;
--智慧匹配看到雜湊和正規表示式，會知道該遍歷%names的所有鍵，用給定的正規表示式逐個測試

比較兩個陣列(簡單起見，只考慮等長陣列)
Foreach my $index ( 0 .. $#names1 ){
Last unless $names[$index] eq $name2[$index];
$equal++;
}
Print “The arrays have the same elements!\n” if $equal == @names1;
--智慧匹配改寫 say “The arrays have the same elements!” if @names1 ~~ @names2;

%a ~~ %b—雜湊的鍵是否一致
%a ~~ @b—至少%a中的一個鍵在列表@b之中
%a ~~ /Fred/--至少一個鍵匹配給定的模式
%a ~~ ‘Fred’—雜湊中某一指定鍵$a[Fred]是否存在
@a ~~ /Fred/--有一個元素匹配給定的模式
@b ~~ ‘Fred’—至少有一個元素轉化為字串後是’Fred’

Give-when匹配
--與if-elsif-else相比，可以在滿足某個條件的基礎上繼續測試其他條件
Given( $ARGV[0] ) {
When( /fred/i ) {say ‘name has fred in it; continue}
When( /^Fred/ ) {say ‘name starts with Fred’; continue}
When( ‘Fred’ ) { say ‘name is Fred’ }
Default { say “ I don’t see a Fred’}
}

程式管理
System函式
--呼叫unix、shell命令
System “date”;--輸出當前時間
--利用shell啟用後臺程式
System “long_running_command with parameters &”;--啟動shell，&會讓long_running_command成為後臺程式並立即執行，而perl接到shell的返回值會繼續執行下一步
System ‘for I in *;do echo == $i ==; cat $i; done;’;--列出當前目錄下所有檔名及其內容

避免使用shell
--system呼叫一個以上的引數，將不會用到shell
--unix中執行成功返回0，
!system “rm –rf files_to_delete” or die “something went wrong”;

Exec函式
--與system區別：system會闖進子程式，其在perl睡眠期間執行任務；而exec卻導致perl自己去執行任務
--一旦啟動要執行的程式，perl便放手退出，因此exec之後寫的任何程式碼都無法執行，除非是程式設計接管啟動過程中的錯誤，如die

用反引號捕獲輸出結果
--system/exec呼叫程式的輸出都會定向到perl的標準輸出，可以用反引號捕獲輸出的字串
Chomp(my $no_newline_now = `date`);
--類似於system的單引數形式，但不需要捕獲輸出的時候，最好不要使用反引號

在列表上下文中使用反引號
--標量上下文 my $who_text = `who`;--就一行
--列表上下文 my @who_lines = `who`;--會自動拆成多行
Foreach (`who`) {
My($user,$tty,$date) = /(\S+) \s+ (\S+) \s+ (.*)/;
$ttys{$user} .= “$tty at $date\n”;
}

將程式視為檔案控制程式碼
--perl可以啟動一個非同步執行的子程式，並和它保持通訊，直到子程式結束
Open DATE, “date | “ or die “cannot pipe from date: $!”;
豎線在命令右邊，表示執行時它的輸出會轉向只讀的檔案控制程式碼DATE，就像shell的date | your_programm
Open MAIL, “| mail Merlyn” or die “cannot pipe to mail: $!”;
豎線在命令左邊，類似shell的your_mail | mail Merlyn
Open F, “find / -atime +90 –size +1000 –print | “ or die “fork: $!”;
While () {
Chomp;
Printf “%s size %dk last accessed on %s\n”, $_, (1023 + -s $_)/1024, -A $_;
}
--查詢90天內未被存取過的1000塊以上的大檔案，find工作時，perl會等待；
每找到一個檔案，perl立即收到檔名並進一步分析；如果用反引號則必須等待find徹底搜完後才能有第一行輸出

用fork開展地下工作
--同樣的system “data”，可以改寫為如下
Defined(my $pid= fork) or die “cannot fork: $!”;
Unless ($pid) {
#能執行到這裡的是子程式
Exec “date”;
Die “cannot exec date: $!”;
}
#能執行到這裡的是父程式
Waitpid($pid,0);

傳送及接受訊號
--從perl傳送訊號給別的程式，需要先獲取目標程式的編號
Kill 2, 4201 or die “Cannot signal 4201 with SIGINT: S!”;
--傳送訊號的命令取名kill，2就是SIGINT；如果該程式早已退出，會收到返回的錯誤
Unless (kill 0, $pid) { warn “$pid has gone away!”; }
--程式執行時候建立資料夾，正常處理會刪除，為防止執行時被終止而導致資料夾不能刪除，可運用訊號量
Mkdir $temp_dir, 0700 or die “Cannot create $temp_dir: $!”;
Sub clean_up {
Unlink glob “$temp_dir/*”;
Rmdir $temp_dir;
}
Sub my_int_handler {
&clean_up;
Die “interrupted, exiting…\n”;
}
$SIG(‘INT’) = ‘my_int_handler’;
--對特殊雜湊%SIG賦值，雜湊鍵是訊號名稱(不用寫固定字首SIG)；雜湊值是子程式名，不需要”&”；只要收到SIGINT訊號，perl就會暫停手上事務立刻執行訊號處理子程式
&clean_up;
--下面這個例子是當ctrl+c的時候中斷當前執行而非退出程式；如果沒有ctrl+c，則程式繼續下一次處理；否則終止迴圈
My $int_count;
Sub my_int_handler { $int_count++ };
$SIG(‘INT’) = ‘my_int_handler’;
$int_count = 0;
While () {
…..—一些耗時操作
If ($int_count) {
Last;
}
}

高階perl技巧
用eval捕獲錯誤
--一些如除以0等錯誤如不加處理會讓程式崩潰
Eval { $result = $a / $b };
--執行eval後檢視$@變數，如果為空證明執行成功；否則會報出錯誤資訊；類似pl/sql中的exception捕獲
Foreach my $person (qw/ fred justin /) {
Eval {
    Open FILE, “< $persion” or die “Cannot open file ‘$person’: $!”;
--無法開啟檔案導致錯誤
--其他潛在錯誤
};
If ($@) {
Print “An error occurred ($@)\n”;
}
}
--eval無法捕獲的錯誤：1、讓perl直譯器崩潰的嚴重錯誤，如記憶體不足；2、exit運算子；3、語法錯誤；4、warn警告資訊
--使用eval字串的時候要小心安全漏洞

用grep篩選列表
--從一大堆數字中刪除奇數
Foreach (1..1000) {
Push @odd_numbers, $_ if $_ % 2;
}
--可以使用grep簡化如下：第一個引數是程式碼塊，程式碼塊對後面列表中的每個元素計算
My @odd_numbers = grep { $_ % 2} 1..1000;
--從一個檔案中過濾包含了fred的行
My @matching_lines = grep { /\bfred\b/I } ;

切片
--檔案格式為name:id:address:phone
While () {
Chomp;
My @items = split /:/;
My($name,$phone) = ($item[0],$item[3]);
}
陣列@items只是充當臨時變數，可以取消
My($name,$id,$address,$phone) = split /:/;
但是標量$id,$address又是不必要的，可以寫成
My ($name,undef,undef,$phone) = split /:/;
如果引數個數過多則容易弄錯，此時可以使用列表切片
My($name,$phone) =(split /:/)[0,3];
-1代表最後一個元素
My($first,$last) = (sort @names)[0,-1]—排序後陣列的第一個和最後一個元素
My $mtime = (stat $some_$file)[9]—mtime是stat產生列表的第9個元素，stat周圍的括號是必須的

perl學習筆記1

相關文章