一、樹和森林
1.基本概念
樹狀圖(Tree)又稱為樹,是一種複雜的資料結構。樹是由 n(n>=0)個有限節點組成一個具有層次關係的集合,把它叫做“樹”是因為它看起來像一棵倒掛的樹,也就是說它是根朝上,而葉朝下的。當 n=0 時,稱之為空樹,否則是非空樹。
樹具有以下的特點:
- 每個節點有零個或多個子節點;
- 沒有父節點的節點稱為根節點;
- 每一個非根節點有且只有一個父節點;
- 除了根節點外,每個子節點可以分為多個不相交的子樹。
2.基本術語
子女:若節點的子樹非空,則節點子樹的根即為該節點的子女。
雙親:若節點有子女,則該節點即為子女的雙親。
兄弟:同一節點的子女互稱為兄弟。
度:節點的子女個數即為該節點的度。
分支節點:度不為0的節點即為分支節點。
葉子節點:度為0的節點即為葉子節點。
深度:節點的深度即為該節點所在的層次。
高度:規定葉子節點的高度為1,其雙親節點的高度等於它的高度加1。
森林:森林是 m(m>=0)顆樹的集合。
二、二叉樹
1.基本概念
一顆二叉樹是節點的有限集合,該集合或者為空,或者由一個根節點和兩顆分別稱為左子樹和右子樹的、互不交叉的二叉樹組成(子樹有左右之分,不可顛倒)。下面是二叉樹的五種形態:
2.基本性質
性質1:若二叉樹節點的層次從1開始,則在二叉樹的第 i 層最多有 2i-1 個節點(i>=1)。
性質2:深度為 k 的二叉樹最少有 k 個節點,最多有 2k-1個 節點(k>=1)。
性質3:對任意一顆二叉樹,如果其葉子節點有 m 個,度為2的非葉子節點為 n 個,則有:m = n + 1。
設度為1的節點有 p 個,總節點數為 x,總邊數為 e,則 x = m + n + p,e = n - 1 = 2 * n + p。因此有:
2 * n + p = m + n + p - 1
n = m - 1
m = n + 1
3.滿二叉樹和完全二叉樹
1)滿二叉樹:除了最後一層無任何子節點,每一層的所有節點都有兩個子節點,即除了葉子節點外的所有節點均有兩個子節點,這樣的二叉樹就稱為滿二叉樹。
2)完全二叉樹:設一個二叉樹的深度為 k,即共有 k 層。除了第 k 層外,其他各層的節點數都達到最大個數,且最後一層上只缺少右邊的若干節點,這樣的二叉樹就稱為完全二叉樹。
4.Python 實現
下面是用 Python 實現的一個二叉樹的程式碼,除了實現建立二叉樹,還實現了四種遍歷二叉樹的方法,分別是:前序遍歷、中序遍歷、後序遍歷和層次遍歷。
1 # 自定義樹節點
2 class Node:
3 def __init__(self, value=None, left=None, right=None):
4 self.value = value
5 self.left = left
6 self.right = right
7
8
9 # 自定義二叉樹
10 class BinaryTree:
11 def __init__(self, value=None, left=None, right=None):
12 """
13 根據傳入的引數決定樹的形態
14 :param value: 節點值
15 :param left: 左子樹
16 :param right: 右子樹
17 """
18 self.root = Node(value, left, right) if value else None
19
20 def is_empty(self):
21 """
22 判斷是否為空樹
23 :return:
24 """
25 return True if self.root else False
26
27 def get_root(self):
28 """
29 獲取根節點
30 :return:
31 """
32 return self.root
33
34 def get_left(self):
35 """
36 獲取左子樹
37 :return:
38 """
39 return self.root.left if self.root else None
40
41 def get_right(self):
42 """
43 獲取右子樹
44 :return:
45 """
46 return self.root.right if self.root else None
47
48 def set_left(self, node: Node):
49 """
50 設定左子樹
51 :param node: 樹節點
52 :return:
53 """
54 self.root.left = node
55
56 def set_right(self, node: Node):
57 """
58 設定右子樹
59 :param node: 樹節點
60 :return:
61 """
62 self.root.right = node
63
64 def pre_traverse(self, node: Node):
65 """
66 前序遍歷
67 :param node: 根節點
68 :return:
69 """
70 if not node:
71 return
72 print(node.value, end=" ")
73 self.pre_traverse(node.left)
74 self.pre_traverse(node.right)
75
76 def mid_traverse(self, node: Node):
77 """
78 中序遍歷
79 :param node: 根節點
80 :return:
81 """
82 if not node:
83 return
84 self.mid_traverse(node.left)
85 print(node.value, end=" ")
86 self.mid_traverse(node.right)
87
88 def after_traverse(self, node: Node):
89 """
90 後序遍歷
91 :param node: 根節點
92 :return:
93 """
94 if not node:
95 return
96 self.after_traverse(node.left)
97 self.after_traverse(node.right)
98 print(node.value, end=" ")
99
100 def level_traverse(self, nodes: list):
101 next_nodes = []
102 if nodes:
103 for node in nodes:
104 print(node.value, end=" ")
105 if node.left:
106 next_nodes.append(node.left)
107 if node.right:
108 next_nodes.append(node.right)
109 self.level_traverse(next_nodes)
當然光有這些方法還是不夠的,因為要一個個的建立節點還是很麻煩,我們可以將一個樹節點定義成一個三元組:
(樹節點的值,左子樹,右子樹)
而左子樹和右子樹也都可以用這種三元組來表示,例如下面是一顆二叉樹的三元組表示:
(F, (C, A, (D, B, None)), (E, H, (G, M, None)))
因此還需要實現一個將這種三元組表達形式轉換成二叉樹的方法:
1 def create(self, data: tuple):
2 """
3 建立一個二叉樹
4 :param data: 例如(1,(2,4,5),(3,6,7))
5 """
6 self.root = self.parse(data)
7
8 def parse(self, data: tuple):
9 """
10 解析傳入的三元組,建立二叉樹
11 :param data: 三元組
12 :return:
13 """
14 if data:
15 node = Node(data[0])
16 node.left = self.parse(data[1]) if type(data[1]) == tuple else Node(data[1])
17 node.right = self.parse(data[2]) if type(data[2]) == tuple else Node(data[2])
18 return node
三、樹的應用
1.表示式計算問題
1)問題描述
一個結構正確的二元表示式對應於一個滿二叉樹,例如下面這樣一顆二叉樹:
這樣一顆二叉樹前序遍歷得到“-+1*23/45”,後序遍歷得到“123*+45/-”,正是波蘭表示式的形式,而其中序遍歷結果就是“1+2*3-4/5”,基本就是相應數學表示式的正確形式,只是缺少了表達計算順序的括號。輸入一個簡單的只包含四則運算的數學計算表示式,求出其計算後的結果。
2)問題分析
對於任意一個二元表示式(如“a+b”)都可以用一個三元組來表示(如“('+', a, b)”),而像上面示例中的表示式,就可以用下面這種三元組表示:
("-", ("+", 1, ("*", 2, 3)), ("/", 4, 5))
這種三元表示式都包含一個操作符設為 op,兩個運算元分別為 x 和 y,因而可以寫出下面的計算方法:
1 if op == "+":
2 return x + y
3 if op == "-":
4 return x - y
5 if op == "*":
6 return x * y
7 if op == "/":
8 return x / y if y else 0
那麼現在的問題就是如何將數學表示式轉換成二叉樹,再就根據二叉樹得到三元組,最後就能使用上面的方法把表示式的值求出來了。因為我們都知道在沒有括號的情況下,乘除的優先順序是高於加減的,而利用二叉樹求解表示式時會從下往上,從葉子節點往根節點進行計算,所以要把加減號放在上面,乘除號放在下面。
3)二叉樹求解
下面是根據輸入的表示式字串建立二叉樹的具體程式碼:
1 def build_tree(input_string):
2 """
3 根據輸入的表示式字串建立二叉樹
4 :param input_string: 輸入表示式
5 :return:
6 """
7 if "+" in input_string or "-" in input_string:
8 for i in range(len(input_string)):
9 if input_string[i] in ["+", "-"] and "+" not in input_string[i + 1:] and "-" not in input_string[i + 1:]:
10 node = Node(input_string[i], build_tree(input_string[:i]), build_tree(input_string[i + 1:]))
11 return node
12 elif "*" in input_string or "/" in input_string:
13 for i in range(len(input_string)):
14 if input_string[i] in ["*", "/"]:
15 node = Node(input_string[i], build_tree(input_string[:i]), build_tree(input_string[i + 1:]))
16 return node
17 else:
18 return Node(input_string)
在生成二叉樹之後,還要根據這個二叉樹得到三元組,下面就是使用遞迴演算法得到三元組的程式碼:
1 def trans(self, node: Node, data: tuple):
2 """
3 將二叉樹轉換成三元組
4 :param node: 節點
5 :param data: 三元組
6 :return:
7 """
8 left = self.trans(node.left, data) if node.left.left else node.left.value
9 right = self.trans(node.right, data) if node.right.left else node.right.value
10 data = (node.value, left, right)
11 return data
現在已經能生成二叉樹並得到表示式的三元組了,再就是求值了,下面是使用遞迴演算法計算三元表示式的值的程式碼:
1 def solution(e):
2 """
3 計算表示式的值
4 :param e: 轉化成三元組表達的計算表示式
5 :return:
6 """
7 if type(e) == tuple:
8 op, a, b = e[0], solution(e[1]), solution(e[2])
9 x, y = float(a), float(b)
10 if op == "+":
11 return x + y
12 if op == "-":
13 return x - y
14 if op == "*":
15 return x * y
16 if op == "/":
17 return x / y if y else 0
18 else:
19 return e
求解計算表示式的程式碼已經完成了,下面是使用這些程式碼來求"1+2*3-4/5"的程式碼示例:
1 s = build_tree("1+2*3-4/5")
2 tree = Tree()
3 tree.root = s
4 exp = tree.trans(s, ())
5 print(solution(exp))
6 # 6.2