【傳統影像處理】1 數字影像基礎

一顆蘋果OAOA發表於2020-11-07


前言

     為保證《數字影像處理》知識體系的完整性,做本章總結如下。本章全部為基礎基本知識,無繁雜公式。


1 視覺感知要素

     人的眼睛形狀近似為一個球體,平均直徑約為20mm。有三薄膜包圍著眼睛:角膜與鞏膜外殼、脈絡膜和視網膜。
     角膜是一種硬而透明的組織,覆蓋著眼睛的前表面。與角膜相連的鞏膜是一層包圍著眼球其餘部分的不透明的的膜。
     脈絡膜的最前面分為睫狀體和虹膜。

     虹膜的收縮和擴張控制著進入眼睛的光亮。虹膜中間的開口(瞳孔)的直徑是可變的,範圍大概在2-8mm。
晶狀體由同心的纖維細胞層組成,並由附在睫狀體上的纖維懸掛著。晶狀體包含60%~70%的水、6%的脂肪和比眼睛中其他組織都多的蛋白質。晶狀體吸收8%的可見光譜,對短波長的光有較高的吸收率。在晶狀體結構中,蛋白質吸收紅外光和紫外光,吸收過量時會傷害眼睛。白內障疾病即是晶狀體受損。
     眼睛裡最裡面的膜是視網膜。來自眼睛外部物體的光在視網膜上成像。由視網膜表面分佈的不連續的光,感受器提供了圖案視覺。有兩類光感受器:錐狀體和桿狀體。

  • 每隻眼睛中的錐狀體數量在600-700萬之間,他們主要位於視網膜的中間部分,稱之為中央凹,且對顏色高度敏感。每個錐狀體都連線到自身的神經末梢,肌肉控制眼球轉動,知道感興趣的物體影像落到中央凹上。錐狀體視覺稱為白晝視覺或亮視覺;
  • 約有7500-15000萬個桿狀體分佈在視網膜表面,它用來給出視野內的一般的總體影像,沒有彩色感覺,而對低照明度敏感。例如在白天呈現鮮明色彩的物體,在月光下都沒有顏色,因為此時只有桿狀體受刺激。這種現象稱為暗視覺或微光視覺。
  • 感受器的分佈是關於中央凹對稱的。
  • 中央凹本身是視網膜中直徑約為1.5mm的圓形凹坑。

     在獲取一張圖片時,人眼與相機是恰恰相反的。對於相機,鏡頭有固定的焦距,各種距離的聚焦是通過改變鏡頭與成像平面間的距離實現;在人眼中,晶狀體和成像區域(視網膜)之間是固定的,實現正確聚焦的焦距是通過改變晶狀體的形狀來得到的。人眼晶狀體中心和視網膜沿視軸的距離大約是17mm,焦距約為14-17mm,在眼睛放鬆且聚焦距離大於3m時,焦距約為17mm。

     實驗資料指出,主觀亮度(即由人的視覺系統感知的亮度)是進入人眼的光強的對數函式。在低照明水平下,視覺由桿狀體執行,在高照明水平下,視覺由錐狀體執行。

     人眼的視覺系統往往會在不同強度區域的邊界處出現"下衝"或"上衝"現象。下圖中,雖然條帶的強度恆定,但在靠近邊界處實際感知到了帶有毛邊的亮度模式,這些看起來帶有毛邊的帶稱為馬赫帶

在這裡插入圖片描述


2 光和電磁波譜

     人眼可見光的彩色範圍只佔電磁波的一小部分,在波譜的一端是無線電波,其波長是可見光波長的幾十億倍。波譜的另一端是伽馬射線,其波長比可見光小几百萬倍。
在這裡插入圖片描述

電磁波譜可用波長、頻率或能量來描述:
     波長λ和頻率v的關係為:λ=c/v
     其中c是光速(2.998×1e8 m/s)
電磁波譜的各個分量的能量公式為:E=hλ
     其中h是普朗克常數。

     光是一種特殊的電磁輻射,電磁波譜的可見光波段的跨越範圍約為0.43μm(紫色)~0.79μm(紅色)。人感受一個物體的顏色由物體反射光的性質決定,比如綠色物體反射波範圍為500-570nm的光,而吸收其他波長的大部分能量。
     關於光的能量,本人做過飛秒近視手術,已經瞭解過電磁波的強大威力?

     寫到這裡,想到關於防藍光眼鏡的問題。首先查到的一段話:

因為藍光是自然可見光的一部分,電腦、手機等電子螢幕也會發出藍光。因為藍光的波長比較短,能量也比較高。如果過多的藍光進入到視網膜,特別是到達眼底黃斑區時可以導致黃斑病變。晶狀體如果吸收有害的藍光,也會導致混濁而得白內障。

     對於個人理解,如果是因為藍光的能量較高的原因,那麼也可以由防紫光眼鏡,畢竟紫光的能量是可見光中能量最高的;其次人眼成像改變焦距的功勞大大歸功於晶狀體,眼球中的睫狀肌通過改變晶狀體的形狀才可以對遠處物體進行對角,近視也是因為晶狀體受到傷害而導致。(但是師兄說他看過中科院的實驗報告講到,防藍光眼鏡是不不會起到作用的,我們也不懂。。。☹️)

還有通常講到的遠眺,也是為了緩解晶狀體形狀,促進睫狀肌的"鍛鍊"!

  • 沒有顏色的光稱為單色光或無色光,單色光的唯一屬性是它的強度或大小,灰度級一詞常用來表示單色光的強度。

  • 有三個基本量用於描繪彩色光源的質量:發光強度、光通量和亮度。發光強度是從光源流出能量的總量,通常用瓦特(W)來度量。光通量給出觀察者從光源感受到的能量,通常用流明數(lm)來度量。亮度是光感知的主觀描繪子,它實際上不能度量。


3 獲取一張數字影像

     成像感測器是將照射能量變換為數字影像的一種裝置。成像感測器中的感測材料接收外界的光能能量,並輸出電壓波形。感測器的響應正比於投射到感測器表面的光能總量,即生成影像的亮度值正比於物理源(如電磁波)所輻射的能量。

     為了產生一幅數字影像,需要把連續的感知資料轉換為數字形式,這種轉換包括:取樣和量化。如下圖為一幅感測器採集到的影像。
在這裡插入圖片描述

     對座標軸進行數字化稱為取樣,對幅值進行數字化稱為量化。下圖左為取樣結果,下圖右為量化結果。這樣便得到了一幅數字影像。數字影像的質量在很大程度上取決於取樣和量化所用的樣本數和灰度級。

在這裡插入圖片描述

     數字化過程要求針對影像的大小M×N和離散灰度級數L做出判定。對於M和N必須取正整數外沒有其他限制,而出於儲存和量化硬體的考慮,灰度級數典型地取為2的整數次冪,即L=2k

  • 將影像系統的動態範圍定義為系統中最大可度量灰度與最小可檢測灰度之比,其上限取決於飽和度,下限取決於噪聲。
  • 飽和度是指超過某個灰度值的畫素均被設定為最高閾值,即整個飽和區域具有恆定的高灰度級。
  • 定義一幅影像中最高和最低灰度級間的灰度差為對比度。

     空間解析度是影像中可辨別的最小細節的度量。每單位距離點數(畫素數)是通用的度量,使用每英寸點數(dpi,dots per inch)來表示。

空間解析度關係到沖印照片的大小、列印圖片的精度,舉個例子:

對於200萬畫素的數位相機,有效畫素192萬,最大輸出1600×1200的相片:
     寬:1600 Pixels/300 dpi=5.3"
     高:1200 Pixels/300 dpi=4"
也就是說如果用300dpi輸出解析度沖印,最多能沖印5.3×4英寸的照片,而通常照片的尺寸是:
     5寸:5×3.5
     6寸:6×4
很明顯的看出,200萬畫素能以300dpi的效果沖印最大5寸的照片。

     (注:人眼能分辨出的最大解析度是300dpi,超過這個解析度,人的眼睛是無法看出差別的,也就是說300dpi600dpi在人眼看來是沒有差別的,所以現在的沖印裝置最大的設計輸出解析度,就是300dpi,當然每個人對於清晰度的要求是不一樣的,一般來說能達到200dpi就能讓大部分人滿意。)


4 數字影像處理

     一幅數字影像可表示為一個矩陣,其中的每個畫素對應於矩陣中的一個值,可以對矩陣中的每個值進行算術操作來處理影像,即對矩陣中的每一個灰度值進行操作 ,包括降噪、增強、矯正陰影等;也可以對矩陣進行空間變換以完成影像的尺度變換、旋轉、平移、偏移等;此外還可以將影像首先轉移到變換域中執行指定任務,最後再用反變換返回到空間域。

關於影像的resize問題:
     日常總會對影像進行放大、收縮、旋轉和幾何校正等工作,這是基於影像內插方法完成的。有三種基本的內插方式:

  • 最近鄰內插法:把原影像中最近鄰的灰度賦給每個新位置;
  • 雙線性差值:使用畫素點的四鄰域畫素進行計算,令v(x, y)表示灰度值,則雙線性差值公式滿足在這裡插入圖片描述
  • 雙三次內插:使用畫素點的16個最近鄰點進行計算。雙線性內插在保持細節方面比雙線性內插相對要好。經常使用的PS就是使用的雙三次內插方法。

關於影像中邊緣和邊界的區別:
     邊緣是具有某些超過預先設定的閾值的導數值的畫素形成的,邊緣的概念是基於在進行灰度級度量時不連續點的"區域性"概念;而一個有限區域的邊界形成一條閉合通路,並且是"整體"概念。邊緣和邊界吻合的一個例外是二值影像的情況,把邊緣考慮為灰度不連續和邊界是閉合通路是有幫助的。


總結

《數字影像處理》2020年前刷完。

相關文章