python3.4之決策樹

勿在浮沙築高臺LS發表於2016-12-22

#!/usr/bin/env python
# coding=utf-8

import numpy as np
from sklearn import tree
from sklearn.metrics import precision_recall_curve
from sklearn.metrics import classification_report
from sklearn.cross_validation import train_test_split
import pydot
from sklearn.externals.six import StringIO

def loadDataSet():
    data = []
    label = []
    with open('D:python/fat.txt') as file:
        for line in file:
            tokens = line.strip().split(' ')
            data.append([float(tk) for tk in tokens[:-1]])
            label.append(tokens[-1])
    x = np.array(data)
    print('x:')
    print(x)
    label = np.array(label)
    y = np.zeros(label.shape)
    y[label == 'fat'] = 1
    print('y:')
    print(y)
    return x, y

def decisionTreeClf():
    x, y = loadDataSet()

    # 拆分資料集和訓練集
    x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
    print('x_train:');
    print(x_train)
    print('x_test:');
    print(x_test)
    print('y_train:');
    print(y_train)
    print('y_test:');
    print(y_test)
    # 使用資訊熵作為劃分標準
    clf = tree.DecisionTreeClassifier(criterion='entropy')
    print(clf)
    clf.fit(x_train, y_train)
    dot_data = StringIO() 
    with open("iris.dot", 'w') as f: 
        f=tree.export_graphviz(clf, out_file=f)
        tree.export_graphviz(clf, out_file=dot_data)
        graph = pydot.graph_from_dot_data(dot_data.getvalue())  
        graph[0].write_pdf("ex.pdf")  
#         Image(graph.create_png())
    # 列印特徵在分類起到的作用性
    print(clf.feature_importances_)

    # 列印測試結果
    answer = clf.predict(x_train)
    print('x_train:')
    print(x_train)
    print('answer:')
    print(answer)
    print('y_train:')
    print(y_train)
    print('計算正確率：')
    print(np.mean(answer == y_train))

    # 準確率與召回率
    precision, recall, thresholds = precision_recall_curve(y_train, clf.predict(x_train)
)
    answer = clf.predict_proba(x)[:, 1]
    print(classification_report(y, answer, target_names=['thin', 'fat']))

decisionTreeClf()
# print('ll')

資料集fat.txt檔案內容如下：

1.5 50 thin
1.5 60 fat
1.6 40 thin
1.6 60 fat
1.7 60 thin
1.7 80 fat
1.8 60 thin
1.8 90 fat
1.9 70 thin
1.9 80 fat

所需要的python包有：
pygraphviz (1.3.1)
pyparsing (2.1.10)
scikit-learn (0.18.1)
pygraphviz (1.3.1)包是視覺化包。
下載視覺化工具：
graphviz-2.38.msi
百度搜尋安裝視覺化工具。

決策樹
2024-07-27
機器學習之決策樹
2024-06-09
機器學習
決策樹模型(3)決策樹的生成與剪枝
2024-03-28
模型
決策樹示例
2021-01-16
4. 決策樹
2020-10-26
Decision tree——決策樹
2020-04-30
決策樹（Decision Tree）
2021-07-13
Python機器學習：決策樹001什麼是決策樹
2020-12-24
Python機器學習
遊戲AI之決策結構—行為樹
2019-09-30
遊戲AI
機器學習之決策樹演算法
2019-07-28
機器學習演算法
分類——決策樹模型
2020-10-23
模型
決策樹演算法
2022-03-07
演算法
ML《決策樹（三）CART》
2020-12-30
機器學習：決策樹
2020-08-01
機器學習
關於決策樹的理解
2024-10-25
決策樹學習總結
2018-04-02
決策樹和隨機森林
2020-12-11
隨機森林
機器學習之決策樹(Decision Tree)python實現
2018-06-12
機器學習Python
機器學習之使用sklearn構造決策樹模型
2019-07-30
機器學習模型
機器學習經典演算法之決策樹
2019-06-16
機器學習演算法
機器學習之決策樹原理和sklearn實踐
2019-06-24
機器學習
機器學習之決策樹在sklearn中的實現
2019-03-06
機器學習
機器學習之決策樹ID3(python實現)
2019-02-27
機器學習Python
決策樹模型(2)特徵選擇
2024-03-26
模型特徵
機器學習——決策樹模型
2023-12-26
機器學習模型
大資料————決策樹（decision tree）
2022-10-20
大資料
ML《決策樹（一）ID3》
2020-12-27
ML《決策樹（二）C4.5》
2020-12-27
【Python機器學習實戰】決策樹和整合學習（二）——決策樹的實現
2021-08-25
Python機器學習
人工智慧之機器學習基礎——決策樹（Decision Tree）
2024-11-19
人工智慧機器學習
02決策樹-初識與構建
2018-10-30
深入淺出學習決策樹（二）
2019-03-18
決策樹在sklearn中的實現
2019-03-07
決策樹模型(1)總體介紹
2024-03-23
模型
決策樹模型(4)Cart演算法
2024-04-09
模型演算法
決策樹演算法-實戰篇
2020-11-16
演算法
決策樹詳解，從熵說起
2020-10-25
熵
決策樹演算法-理論篇
2020-11-09
演算法
深入淺出學習決策樹（一）
2019-03-14

python3.4之決策樹

相關文章