如何用程式解圖片迷宮？

熊崽Kevin發表於2014-03-21

譯註：原文是StackOverflow上一個如何用程式讀取迷宮圖片並求解的問題，幾位參與者熱烈地討論並給出了自己的程式碼，涉及到用Python對圖片的處理以及廣度優先(BFS)演算法等。

問題by Whymarrh：

當給定上面那樣一張JPEG圖片，如何才能更好地將這張圖轉換為合適的資料結構並且解出這個迷宮？

我的第一直覺是將這張圖按畫素逐個讀入，並儲存在一個包含布林型別元素的列表或陣列中，其中True代表白色畫素，False代表非白色畫素（或彩色可以被處理成二值影像）。但是這種做法存在一個問題，那就是給定的圖片往往並不能完美的“畫素化”。考慮到如果因為圖片轉換的原因，某個非預期的白色畫素出現在迷宮的牆上，那麼就可能會創造出一一條非預期的路徑。

經過思考之後，我想出了另一種方法：首先將圖片轉換為一個可縮放適量圖形(SVG)檔案，這個檔案由一個畫布上的向量線條列表組成，向量線條按照列表的順序讀取，讀取出的仍是布林值：其中True表示牆，而False表示可通過的區域。但是這種方法如果無法保證影像能夠做到百分之百的精確轉換，尤其是如果不能將牆完全準確的連線，那麼這個迷宮就可能出現裂縫。

影像轉換為SVG的另一個問題是，線條並不是完美的直線。因為SVG的線條是三次貝塞爾曲線，而使用整數索引的布林值列表增加了曲線轉換的難度，迷宮線條上的所有點在曲線上都必須經過計算，但不一定能夠完美對應列表中的索引值。

假設以上方法的確可以實現(雖然很可能都不行)，但當給定一張很大的影像時，它們還是不能勝任。那麼是否存在一種更好地方法能夠平衡效率和複雜度？

這就要討論到如何解迷宮了。如果我使用以上兩種方法中的任意一種，我最終將會得到一個矩陣。而根據這個問答(http://stackoverflow.com/questions/3097556/programming-theory-solve-a-maze/3097677#3097677)，一個比較好的迷宮表示方式應該是使用樹的結構，並且使用A*搜尋演算法來解迷宮。那麼如何從迷宮圖片中構造出迷宮樹呢？有比較好的方法麼？

以上廢話太多，總結起來問題就是：如何轉換迷宮圖片？轉換成為什麼樣的資料結構？採用什麼樣的資料結構能夠幫助或阻礙解迷宮？

回答by Mikhail:

這是我的解決方案：

1. 將圖片轉換為灰度影像(不是直接二值)，調整不同顏色的權重使得最終的灰度看起來比較統一，你可以通過簡單地調節Photoshop 影像->調整->黑白選單中的控制條來實現。
2. 將上一步得到的灰度圖片轉換為二值圖片，可以通過在PS 影像->調整->閾值選單中設定適當的閾值來實現
3. 確保正確設定了閾值。使用魔棒工具(引數設定：容差 0、取樣點、連續以及消除鋸齒)選擇空白區域，檢查所選區域的邊緣不是因為錯誤的閾值設定而產生的假邊緣。事實上，這個迷宮中從start到end應該由聯通的空白區域。
4. 人為地在迷宮外部加上邊界，確保迷宮漫遊者^_^不會從start繞著迷宮跑到終點。:)
5. 選擇語言實現廣度優先搜尋演算法(BFS)，從start處開始讓程式執行。下面的程式碼我選擇用Matlab實現。正如Thomas提到的，沒必要糾結於影像的表示形式，你可以直接在二值影像上執行。

以下是用MATLAB實現的BFS程式碼：

function path = solve_maze(img_file)
  %% Init data
  img = imread(img_file);
  img = rgb2gray(img);
  maze = img &gt; 0;
  start = [985 398];
  finish = [26 399];

  %% Init BFS
  n = numel(maze);
  Q = zeros(n, 2);
  M = zeros([size(maze) 2]);
  front = 0;
  back = 1;

  function push(p, d)
    q = p + d;
    if maze(q(1), q(2)) &amp;&amp; M(q(1), q(2), 1) == 0
      front = front + 1;
      Q(front, :) = q;
      M(q(1), q(2), :) = reshape(p, [1 1 2]);
    end
  end

  push(start, [0 0]);

  d = [0 1; 0 -1; 1 0; -1 0];

  %% Run BFS
  while back &lt;= front
    p = Q(back, :);
    back = back + 1;
    for i = 1:4
      push(p, d(i, :));
    end
  end

  %% Extracting path
  path = finish;
  while true
    q = path(end, :);
    p = reshape(M(q(1), q(2), :), 1, 2);
    path(end + 1, :) = p;
    if isequal(p, start) 
      break;
    end
  end
end

function path = solve_maze(img_file)

%% Init data

img = imread(img_file);

img = rgb2gray(img);

maze = img > 0;

start = [985 398];

finish = [26 399];

%% Init BFS

n = numel(maze);

Q = zeros(n, 2);

M = zeros([size(maze) 2]);

front = 0;

back = 1;

function push(p, d)

q = p + d;

if maze(q(1), q(2)) && M(q(1), q(2), 1) == 0

front = front + 1;

Q(front, :) = q;

M(q(1), q(2), :) = reshape(p, [1 1 2]);

end

push(start, [0 0]);

d = [0 1; 0 -1; 1 0; -1 0];

%% Run BFS

while back <= front

p = Q(back, :);

back = back + 1;

for i = 1:4

push(p, d(i, :));

end

%% Extracting path

path = finish;

while true

q = path(end, :);

p = reshape(M(q(1), q(2), :), 1, 2);

path(end + 1, :) = p;

if isequal(p, start)

break;

end

這是個簡單的實現，應該很容易就能夠改寫為Python或其他語言，下面是程式的執行結果：

提問者更新：

我用Python實現了一下Mikhail的方法，其中用到了numpy庫，感謝Thomas推薦。我感覺這個演算法是正確的，但是效果不太如預期，以下是相關程式碼，使用了PyPNG庫處理圖片。

譯註：很遺憾，我用提問者提供的程式碼並沒有跑通程式，並且似乎程式碼縮排有點問題，而下面其他參與者的程式碼能夠執行通過，並且效果很好。

import png, numpy, Queue, operator, itertools

def is_white(coord, image):
  &quot;&quot;&quot; Returns whether (x, y) is approx. a white pixel.&quot;&quot;&quot;
  a = True
  for i in xrange(3):
    if not a: break
    a = image[coord[1]][coord[0] * 3 + i] &gt; 240
  return a

def bfs(s, e, i, visited):
  &quot;&quot;&quot; Perform a breadth-first search. &quot;&quot;&quot;
  frontier = Queue.Queue()
  while s != e:
    for d in [(-1, 0), (0, -1), (1, 0), (0, 1)]:
      np = tuple(map(operator.add, s, d))
      if is_white(np, i) and np not in visited:
        frontier.put(np)
    visited.append(s)
    s = frontier.get()
  return visited

def main():
  r = png.Reader(filename = &quot;thescope-134.png&quot;)
  rows, cols, pixels, meta = r.asDirect()
  assert meta[&#039;planes&#039;] == 3 # ensure the file is RGB
  image2d = numpy.vstack(itertools.imap(numpy.uint8, pixels))
  start, end = (402, 985), (398, 27)
  print bfs(start, end, image2d, [])

import png, numpy, Queue, operator, itertools

def is_white(coord, image):

""" Returns whether (x, y) is approx. a white pixel."""

a = True

for i in xrange(3):

if not a: break

a = image[coord[1]][coord[0] * 3 + i] > 240

return a

def bfs(s, e, i, visited):

""" Perform a breadth-first search. """

frontier = Queue.Queue()

while s != e:

for d in [(-1, 0), (0, -1), (1, 0), (0, 1)]:

np = tuple(map(operator.add, s, d))

if is_white(np, i) and np not in visited:

frontier.put(np)

visited.append(s)

s = frontier.get()

return visited

def main():

r = png.Reader(filename = "thescope-134.png")

rows, cols, pixels, meta = r.asDirect()

assert meta['planes'] == 3 # ensure the file is RGB

image2d = numpy.vstack(itertools.imap(numpy.uint8, pixels))

start, end = (402, 985), (398, 27)

print bfs(start, end, image2d, [])

回答by Joseph Kern：

#!/usr/bin/env python

import sys

from Queue import Queue
from PIL import Image

start = (400,984)
end = (398,25)

def iswhite(value):
    if value == (255,255,255):
    return True

def getadjacent(n):
    x,y = n
    return [(x-1,y),(x,y-1),(x+1,y),(x,y+1)]

def BFS(start, end, pixels):

    queue = Queue()
    queue.put([start]) # Wrapping the start tuple in a list

    while not queue.empty():

        path = queue.get() 
        pixel = path[-1]

        if pixel == end:
            return path

        for adjacent in getadjacent(pixel):
            x,y = adjacent
            if iswhite(pixels[x,y]):
                pixels[x,y] = (127,127,127) # see note
                new_path = list(path)
                new_path.append(adjacent)
                queue.put(new_path)

    print &quot;Queue has been exhausted. No answer was found.&quot;

if __name__ == &#039;__main__&#039;:

    # invoke: python mazesolver.py  [.jpg|.png|etc.]
    base_img = Image.open(sys.argv[1])
    base_pixels = base_img.load()

    path = BFS(start, end, base_pixels)

    path_img = Image.open(sys.argv[1])
    path_pixels = path_img.load()

    for position in path:
        x,y = position
        path_pixels[x,y] = (255,0,0) # red

    path_img.save(sys.argv[2])

#!/usr/bin/env python

import sys

from Queue import Queue

from PIL import Image

start = (400,984)

end = (398,25)

def iswhite(value):

if value == (255,255,255):

return True

def getadjacent(n):

x,y = n

return [(x-1,y),(x,y-1),(x+1,y),(x,y+1)]

def BFS(start, end, pixels):

queue = Queue()

queue.put([start]) # Wrapping the start tuple in a list

while not queue.empty():

path = queue.get()

pixel = path[-1]

if pixel == end:

return path

for adjacent in getadjacent(pixel):

x,y = adjacent

if iswhite(pixels[x,y]):

pixels[x,y] = (127,127,127) # see note

new_path = list(path)

new_path.append(adjacent)

queue.put(new_path)

print "Queue has been exhausted. No answer was found."

if __name__ == '__main__':

# invoke: python mazesolver.py [.jpg|.png|etc.]

base_img = Image.open(sys.argv[1])

base_pixels = base_img.load()

path = BFS(start, end, base_pixels)

path_img = Image.open(sys.argv[1])

path_pixels = path_img.load()

for position in path:

x,y = position

path_pixels[x,y] = (255,0,0) # red

path_img.save(sys.argv[2])

動態執行效果：

回答by Jim

使用樹搜尋太繁雜了，迷宮本身就跟解路徑是可分的。正因如此，你可以使用連通區域查詢演算法來標記迷宮中的連通區域，這將迭代搜尋兩次這些畫素點。如果你想要更好地解決方法，你可以對結構單元使用二元運算(binary operations)來填充每個連通區域中的死路。

下面是相關的MATLAB程式碼及執行結果：

% read in and invert the image
im = 255 - imread(&#039;maze.jpg&#039;);

% sharpen it to address small fuzzy channels
% threshold to binary 15%
% run connected components
result = bwlabel(im2bw(imfilter(im,fspecial(&#039;unsharp&#039;)),0.15));

% purge small components (e.g. letters)
for i = 1:max(reshape(result,1,1002*800))
    [count,~] = size(find(result==i));
    if count &lt; 500
        result(result==i) = 0;
    end
end

% close dead-end channels
closed = zeros(1002,800);
for i = 1:max(reshape(result,1,1002*800))
    k = zeros(1002,800);
    k(result==i) = 1; k = imclose(k,strel(&#039;square&#039;,8));
    closed(k==1) = i;
end

% do output
out = 255 - im;
for x = 1:1002
    for y = 1:800
        if closed(x,y) == 0
            out(x,y,:) = 0;
        end
    end
end
imshow(out);

% read in and invert the image

im = 255 - imread('maze.jpg');

% sharpen it to address small fuzzy channels

% threshold to binary 15%

% run connected components

result = bwlabel(im2bw(imfilter(im,fspecial('unsharp')),0.15));

% purge small components (e.g. letters)

for i = 1:max(reshape(result,1,1002*800))

[count,~] = size(find(result==i));

if count < 500

result(result==i) = 0;

end

% close dead-end channels

closed = zeros(1002,800);

for i = 1:max(reshape(result,1,1002*800))

k = zeros(1002,800);

k(result==i) = 1; k = imclose(k,strel('square',8));

closed(k==1) = i;

end

% do output

out = 255 - im;

for x = 1:1002

for y = 1:800

if closed(x,y) == 0

out(x,y,:) = 0;

end

imshow(out);

回答by Stefano

stefano童鞋給出了生成搜尋過程GIF及AVI檔案的程式碼 maze-solver-python (GitHub)

【Javascript + Vue】實現隨機生成迷宮圖片
2021-06-23
JavaScriptVue隨機
走迷宮
2024-08-08
PHP 解迷宮之 H 最小
2019-08-03
PHP
【Javascript + Vue】實現對任意迷宮圖片的自動尋路
2021-06-11
JavaScriptVue
PHP 解迷宮之 G + H 最小
2019-08-05
PHP
回溯法解決迷宮問題
2018-02-08
509迷宮
2024-09-07
如何用js寫一個簡單的迷宮和打地鼠遊戲
2020-10-24
JS遊戲
用C語言解決迷宮問題
2014-06-10
C語言
html程式碼處理（如圖片、字型大小）
2018-01-30
HTML
簡單介紹Python迷宮生成和迷宮破解演算法
2020-04-24
Python演算法
PHP 生成迷宮路線
2019-07-29
PHP
【面試】如何找到迷宮出口
2015-09-23
面試
C++實現迷宮的生成與解決
2020-12-20
C++
[SDOI2012] 走迷宮題解
2024-07-23
迷宮問題——最短程式碼，不到70行
2020-10-19
Python迷宮生成器
2022-07-08
Python
回溯法求迷宮問題
2024-10-12
自動走迷宮小遊戲~
2024-11-04
遊戲
藍橋杯-走迷宮(BFS)
2024-04-12
POJ3984-迷宮問題
2024-09-04
內容是超正統的迷宮RPG？PSP遊戲《迷宮旅人2》深度解析
2021-05-18
遊戲
洛谷 p1605 迷宮問題詳解
2020-05-21
使用A*演算法解迷宮最短路徑問題
2018-08-01
演算法
用 Canvas + WASM 畫一個迷宮
2019-03-03
CanvasASM
51nod 1459 迷宮遊戲
2017-09-14
遊戲
隨機迷宮生成演算法
2016-01-03
隨機演算法
C語言動態走迷宮
2015-08-20
C語言
藍橋杯-迷宮(BFS+DFS)
2024-04-12
用python深度優先遍歷解迷宮問題
2021-07-08
Python
[省選聯考 2024] 迷宮守衛題解
2024-03-10
python九宮格圖片的原理
2021-09-11
Python
解密迷宮問題：三種高效演算法Java實現，讓你輕鬆穿越未知迷宮
2023-04-29
解密演算法Java
走迷宮 -- 民間圖靈獎參賽者名單和作品
2012-11-11
圖靈
華為優招面試題---迷宮問題
2017-07-15
面試題
UOJ #810. 【UNR #7】位元迷宮
2024-07-01
基於JavaFX圖形介面演示的迷宮建立與路徑尋找
2022-06-24
Java
dfs深度優先搜尋解決迷宮類問題(遍歷)
2020-12-05

如何用程式解圖片迷宮？

相關文章