影象中的畫素處理

齊滇大聖發表於2018-08-04

原文網址 : https://juejin.im/post/5b6552586fb9a04fb53ac89b

影象的深度和通道

影象的深度

影象中畫素點佔得bit位數，就是影象的深度，比如以下影象的深度。

二值影象：

影象的畫素點不是0 就是1 （影象不是黑色就是白色），影象畫素點佔的位數就是 1 位，影象的深度就是1，也稱作點陣圖。

灰度影象：

影象的畫素點位於0-255之間，（0：全黑，255代表：全白，在0-255之間插入了255個等級的灰度）。最大值255的二進位制表示為11111111，佔有8個bit位，即2^8=256，影象的深度是8。

影象的通道

通道，是數字影象中儲存不同型別資訊的灰度影象。一個影象最多可以有數十個通道，常用的RGB和Lab影象預設有三個通道，而CMYK影象則預設有四個通道。一張RGB影象含有三個通道：紅（Red）、綠（Green）、藍（Blue）。一張CMYK影象含有四個通道：青色（Cyan）、品紅（Magenta）、黃色、黑色。

所以想灰度圖就只有一個通道，佔有8個bit位，也就是8點陣圖。所以RGB影象佔有三個通道，3*8=24，所以RGB影象就是24點陣圖。

影象在記憶體中的儲存

影象畫素點的儲存就是對應的原圖從左到右，從上到下，依次排列，每個點的值就是就是畫素點的值，每個點的地址就是畫素畫素點的地址。

如第一幅圖就是灰度圖的儲存，只有單通道。在記憶體中的儲存即可用一個一維陣列來表示，根據順序從左到右，從上到下，依次按順序存入陣列。

圖二則為RGB影象的儲存模型，每一個畫素有3個通道，所以需要一個二維陣列來表示，順序也是從左到右，從上到下，如[[234,200,0],[234,0,0],[255,55,0],....]這樣，當然其中的數子，在記憶體中需要用對應的二進位制來表示。

python輸出影象資料

我們來用python來輸出一個圖片的畫素資料，來驗證看看上面所說的儲存模型。

import sys
import tensorflow as tf
from PIL import Image, ImageFilter
import numpy as np

def imageprepare(argv):
    testImage=Image.open(argv).convert('L')
    testImage = testImage.resize((6, 4))
    test_input=np.array(testImage)
    print(test_input)


def main(argv):
    """
    Main function.
    """
    imvalue = imageprepare(argv)
    
if __name__ == "__main__":
    main(sys.argv[1])
複製程式碼

我這裡傳進去一張圖片，然後轉換成L模型（L表示灰度圖），設定寬高位（6，4），輸出如下所示，這裡np.array把圖片資料轉換成了一個二維陣列，方便根據（x,y）來讀取:

[[254 255 254  97 255 248]
 [246 255  15 180 255 255]
 [252 227 227 246  44 252]
 [244 254 229 151 243 248]]
複製程式碼

如我們之前所說根據從左到右，從上到下儲存的話，則可以方便的用以下方法來讀取：

width = testImage.size[0]
height = testImage.size[1]
y = 0
while y<height:
    x = 0
    while x<width:
        print(test_input[y,x])
        x += 1
    y += 1
複製程式碼

對應的RGB圖片，我們轉換模型改一下testImage=Image.open(argv).convert('RGB')，轉換為array之後，就變成了一個rowscolschannels的三維矩陣，輸出讀取如下所示：

[[[254 254 254]
  [255 255 255]
  [254 254 254]
  [ 97  97  97]
  [255 255 255]
  [248 248 248]]

 [[246 246 246]
  [255 255 255]
  [ 15  15  15]
  [180 180 180]
  [255 255 255]
  [255 255 255]]

 [[252 252 252]
  [227 227 227]
  [227 227 227]
  [246 246 246]
  [ 44  44  44]
  [252 252 252]]

 [[244 244 244]
  [254 254 254]
  [229 229 229]
  [151 151 151]
  [243 243 243]
  [248 248 248]]]
複製程式碼

width = testImage.size[0]
height = testImage.size[1]
y = 0
while y<height:
    x = 0
    while x<width:
        # 畫素的3通道值
        print(test_input[y,x])
        print('R: ' + str(test_input[y,x,0]))
        print('G: ' + str(test_input[y,x,1]))
        print('B: ' + str(test_input[y,x,2]))
        x += 1
    y += 1
複製程式碼

iOS仿python影象處理庫PIL

python程式碼

以下為python中PIL把圖片轉換為畫素資料陣列的程式碼，我們先把圖片轉化為RGBA格式，然後輸出對應位置的畫素資料。當然RGBA一個畫素有4個通道，所以我們可以依次輸出每個通道的值，如R通道：test_input[y,x,0]。

def imageprepare(argv):
    testImage=Image.open(argv).convert('RGBA')
    testImage = testImage.resize((28, 28))
    test_input=np.array(testImage)
    print(test_input)
    width = testImage.size[0]
    height = testImage.size[1]
    y = 0
    while y<height:
        x = 0
        while x<width:
            print(test_input[y,x])
            # print('R: ' + str(test_input[y,x,0]))
            x += 1
        y += 1
複製程式碼

iOS程式碼

在iOS中圖片轉化為圖片資料格式相對於python和Android中來講相對麻煩一些，所以我這裡封裝了一個iOS圖片轉圖片資料的類。輸出的格式跟python中類似，但是python支援多種編碼格式，分別為1，L，P，RGB，RGBA，CMYK，YCbCr，I，F。這裡iOS開發中只支援RGBA，CMYK。

在iOS中我們會先根據圖片的編碼格式來生成一個CGContextRef（畫布），以下程式碼是對RGBA格式圖片處理生成的CGContextRef。

- (CGContextRef) newBitmapRGBA8ContextFromImage:(CGImageRef) image {
    
    CGContextRef context = NULL;
    CGColorSpaceRef colorSpace;
    uint32_t *bitmapData;
    
    size_t bitsPerPixel = 32;
    size_t bitsPerComponent = 8;
    size_t bytesPerPixel = bitsPerPixel / bitsPerComponent;
    
    size_t width = CGImageGetWidth(image);
    size_t height = CGImageGetHeight(image);
    
    size_t bytesPerRow = width * bytesPerPixel;
    size_t bufferLength = bytesPerRow * height;
    
    colorSpace = CGColorSpaceCreateDeviceRGB();
    
    if(!colorSpace) {
        NSLog(@"Error allocating color space Gray\n");
        return NULL;
    }
    
    // Allocate memory for image data
    bitmapData = (uint32_t *)malloc(bufferLength);
    
    if(!bitmapData) {
        NSLog(@"Error allocating memory for bitmap\n");
        CGColorSpaceRelease(colorSpace);
        return NULL;
    }
    
    //Create bitmap context
    
    context = CGBitmapContextCreate(bitmapData,
                                    width,
                                    height,
                                    bitsPerComponent,
                                    bytesPerRow,
                                    colorSpace,
                                    kCGImageAlphaPremultipliedLast); 
    if(!context) {
        free(bitmapData);
        NSLog(@"Bitmap context not created");
    }
    
    CGColorSpaceRelease(colorSpace);
    
    return context;
}
複製程式碼

要理解以上程式碼，首先要知道什麼是畫素格式：

點陣圖其實就是一個畫素陣列，而畫素格式則是用來描述每個畫素的組成格式，它包括以下資訊：

Bits per component ：一個畫素中每個獨立的顏色分量使用的 bit 數；
Bits per pixel ：一個畫素使用的總 bit 數；
Bytes per row ：點陣圖中的每一行使用的位元組數。

有一點需要注意的是，對於點陣圖來說，畫素格式並不是隨意組合的，目前iOS、Mac OS X開發只支援以下有限的 17 種特定組合：官方文件

原始碼

DSImageBitmaps這是我iOS原始碼的地址，其中包含了python的程式碼，我iOS裡面的圖片直接使用的是python裁剪過大小的圖片，然後能發現資料的資料是一樣的。

但是我用iOS裡面直接裁剪大小後的圖片就跟python處理過大小的圖片輸出的資料就不一樣了，說是python的image.resize用到了濾波器，具體是什麼我也不太清楚。反正就是iOS和python處理圖片大小內部的演算法有些許差異，但是你能發現每一個畫素上的資料差異不大，具體到一張圖顯示的話人眼是識別不出來的。

還有就算要注意iOS中處理的圖片大小問題，也就是iOS中畫素和image.size的關係：

test.png (畫素 20*20) test@2x.png(畫素40*40) test@3x.png(畫素 60*60)

UIImage *image = [UIImageimageNamed:@"test.png"];

image.size輸出大小為（20，20);


UIImage *image = [UIImage imageNamed:@"test@2x.png"];

image.size輸出大小為（20，20);


UIImage *image = [UIImage imageNamed:@"test@3x.png"];

image.size輸出大小為（20，20);


image.size輸出的大小會自動識別圖片是幾倍的，如果是3倍的輸出的結果就是畫素除以3，2倍的畫素除以2。
複製程式碼

參考

Converting UIImage to RGBA8 Bitmaps and Back

一張圖片引發的深思

談談 iOS 中圖片的解壓縮

[Python影象處理] 二.OpenCV+Numpy庫讀取與修改畫素
2018-08-28
PythonOpenCV
影像行畫素處理
2020-12-16
webgl 影像處理2---影像畫素處理
2021-09-19
Web
影象處理之影象增強
2018-08-12
[Python影象處理] 八.影象腐蝕與影象膨脹
2018-10-31
Python
[Python影象處理] 六.影象縮放、影象旋轉、影象翻轉與影象平移
2018-09-06
Python
數字影象處理DIP
2018-12-26
Python 影像處理 OpenCV （2）：畫素處理與 Numpy 操作以及 Matplotlib 顯示影像
2020-05-19
PythonOpenCV
[Python影象處理] 七.影象閾值化處理及演算法對比
2018-10-30
Python演算法
[Python影象處理] 一.影象處理基礎知識及OpenCV入門函式
2018-08-16
PythonOpenCV函式
影象處理的濾鏡演算法
2018-09-16
演算法
[Python影象處理] 三.獲取影象屬性、興趣ROI區域及通道處理
2018-08-29
Python
如何在Tensorflow.js中處理MNIST影象資料
2018-06-26
JS
[Python影象處理] 五.影象融合、加法運算及影象型別轉換
2018-09-03
Python型別
數字影象處理-第一節
2019-04-10
影象處理庫GPUImage簡單使用
2018-09-19
GPUUI
【筆記】基於Python的數字影象處理
2018-12-03
筆記Python
常用的畫素操作演算法：影像加法、畫素混合、提取影像中的ROI
2019-01-19
演算法
實戰 | 用Python做影象處理（一）
2018-05-23
Python
Android 中的轉場動畫及相容處理
2021-09-09
Android動畫
阿里達摩院首款車載AI處理器：處理200萬畫素，同步6路攝像頭
2020-04-08
阿里AI
Luminar 4 for MacOS影象後期處理軟體
2019-12-06
Mac
畫素畫裡的孤獨
2019-07-22
wx-caman——基於 CamanJS 的微信小程式 Canvas 畫素級濾鏡處理庫
2018-06-21
JS微信小程式Canvas
黑洞圖片的背後，是影象處理技術的成熟！
2019-04-11
掌握web開發基礎系列--物理畫素、邏輯畫素、css畫素
2019-05-07
WebCSS
【譯】Flutter：影象的爆炸動畫?
2020-02-17
Flutter動畫
canvas畫素畫板
2018-11-12
Canvas
修改畫素
2020-06-01
WebComponent+WebGl的實時影象處理彈幕播放器
2019-02-26
Web播放器
什麼是物理畫素和邏輯畫素？
2024-12-07
影象處理1--傅立葉變換（Fourier Transform ）
2019-01-15
ORM
用 CSS 做畫素畫
2018-11-18
CSS
畫素畫——明暗基礎
2024-04-10
人形動畫常見IK的處理
2024-07-20
動畫
[Python影象處理] 九.形態學之影象開運算、閉運算、梯度運算
2018-11-02
Python梯度
[Python影象處理] 十.形態學之影象頂帽運算和黑帽運算
2018-11-04
Python
計算機視覺 OpenCV Android | Mat畫素操作（影象畫素的讀寫、均值方差、算術、邏輯等運算、權重疊加、歸一化等操作）...
2019-01-29
計算機視覺OpenCVAndroid