面向機器智慧的TensorFlow實戰4：機器學習基礎

CopperDong發表於2018-05-25

原文網址 : https://blog.csdn.net/qfire/article/details/80453490

機器學習

程式碼 https://github.com/backstopmedia/tensorflowbook.git

1、監督學習簡介

資料流圖的高層、通用訓練閉環：一種常用的方法是將原始資料集一分為二，將70%的樣本用於訓練，30%用於評估。

2、儲存訓練檢查點

防止突然斷電

3、線性迴歸

目標是找到一個與這些資料最為吻合的線性函式

y(x1, x2, ... , xk) = w1*x1 + w2*x2 + ... + wk * xk + b

其矩陣（或張量）形式為

Y = X*W^T + b, 其中X=(x1, x2, ... , xk) , W = (w1, w2, ... , wk)

如何計算損失：總平方誤差

loss = Sum(Y - Y_predicted)^2

def loss(X, Y):
    Y_prediected = inference(X)
    return tf.reduce_sum(tf.squared_difference(Y, Y_predicted))

資料集http://people.sc.fsu.edu/~jburkardt/datasets/regression/x09.txt

import tensorflow as tf
W = tf.Variable(tf.zeros([2,1]), name="weights")
b = tf.Variable(0., name="bias")
def inference(X): #計算推斷模型的資料X上的輸出
    return tf.matmul(X, W) + b
def loss(X, Y):
    Y_predicted = inference(X)
    return tf.reduce_sum(tf.squared_difference(Y, Y_predicted))
def inputs():
    weight_age = [ [84,46],[73,20],[65,52],[70,30],[76,57],
                   [69,25],[63,28],[72,36],[79,57],[75,44],
                   [27,24],[89,31],[65,52],[57,23],[59,60],
                   [69,48],[60,34],[79,51],[75,50],[82,34],
                   [59,46],[67,23],[85,37],[55,40],[63,30] ]
    blood_fat_content = [354, 190, 405, 263, 451, 302, 288, 
                         385, 402, 365, 209, 290, 346, 254,
                         395, 434, 220, 374, 308, 220, 311,
                         181, 274, 303, 244]
    return tf.to_float(weight_age), tf.to_float(blood_fat_content)
def train(total_loss):
    learning_rate = 0.0000001
    return tf.train.GradientDescentOptimizer(learning_rate).minimize(total_loss)
def evaluate(sess, X, Y):
    print sess.run(inference([[80., 25.]]))  # ～ 303
    print sess.run(inference([[65., 25.]]))  # ～ 256
saver = tf.train.Saver()

with tf.Session() as sess:
    tf.initialize_all_variables().run()
    X, Y = inputs()
    total_loss = loss(X, Y)
    train_op = train(total_loss)
    
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
    
    training_steps = 1000
    for step in range(training_steps):
        sess.run([train_op])
        if step % 10 == 0:
            print "loss: ", sess.run([total_loss])
            #saver.save(sess, 'my-model', global_step=step)
            
    evaluate(sess, X, Y)
    
    coord.request_stop()
    coord.join(threads)
    saver.save(sess, 'my-model', global_step=training_steps)
    sess.close()

4、對數機率迴歸

sigmoid函式，能夠回答Yes-No型別的問題（是否為垃圾郵件）

損失函式：logistic函式會計算回答為"Yes"的概率，損失是模型為那個樣本所分配的概率值，並取平方。

採用交叉熵（cross entropy）損失函式會更為有效：輸出與期望越接近，熵會越小。

資料集https://www.kaggle.com/c/titanic/data

import tensorflow as tf
import os
W = tf.Variable(tf.zeros([5, 1]), name="weights")
b = tf.Variable(0., name="bias")

def combine_inputs(X):
    return tf.matmul(X, W) + b

def inference(X):
    return tf.sigmoid(combine_inputs(X))

def loss(X, Y):
    return tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=combine_inputs(X), labels=Y))

def read_csv(batch_size, file_name, record_defaults):
    filename_queue = tf.train.string_input_producer([os.path.join(os.getcwd(), file_name)])
    
    reader = tf.TextLineReader(skip_header_lines=1)
    key, value = reader.read(filename_queue)
    
    decoded = tf.decode_csv(value, record_defaults=record_defaults)
    return tf.train.shuffle_batch(decoded, batch_size=batch_size, 
                                  capacity=batch_size*50, min_after_dequeue=batch_size)

def inputs():
    passenger_id, survived, pclass, name, sex, age, sibsp, parch, ticket, fare, cabin, embarked = \
       read_csv(100, "train.csv", [[0.0], [0.0], [0], [""], [""], [0.0], [0.0], [0.0], [""], [0.0], [""], [""]])
    is_first_class = tf.to_float(tf.equal(pclass, [1]))
    is_second_class = tf.to_float(tf.equal(pclass, [2]))
    is_third_class = tf.to_float(tf.equal(pclass, [3]))
    
    gender = tf.to_float(tf.equal(sex, ["female"]))
    
    features = tf.transpose(tf.stack([is_first_class, is_second_class, is_third_class, gender, age]))
    survived = tf.reshape(survived, [100, 1])
    return features, survived
def train(total_loss):
    learning_rate = 0.01
    return tf.train.GradientDescentOptimizer(learning_rate).minimize(total_loss)

def evaluate(sess, X, Y):
    predicted = tf.cast(inference(X) > 0.5, tf.float32)
    print sess.run(tf.reduce_mean(tf.cast(tf.equal(predicted, Y), tf.float32)))
with tf.Session() as sess:
    tf.initialize_all_variables().run()
    X, Y = inputs()
    
    total_loss = loss(X, Y)
    train_op = train(total_loss)
    
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
    
    training_steps = 1000
    for step in range(training_steps):
        sess.run([train_op])
        if step % 10 == 0:
            print "loss: ", sess.run([total_loss])
    evaluate(sess, X, Y)
    
    import time
    time.sleep(5)
    
    coord.request_stop()
    coord.join(threads)
    sess.close()

5、softmax分類

希望能夠回答具有多個選項的問題，使用softmax

資料集https://archive.ics.uci.edu/ml/datasets/Iris，包含4個特徵及3個可能的輸出類

import tensorflow as tf
import os
import os.path
import sys
W = tf.Variable(tf.zeros([4,3]), name="weights")
b = tf.Variable(tf.zeros([3]), name="bias")

def combine_inputs(X):
    return tf.matmul(X, W) + b

def inference(X):
    return tf.sigmoid(combine_inputs(X))

def loss(X, Y):
    return tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=combine_inputs(X), labels=Y))

def read_csv(batch_size, file_name, record_defaults):
    filename_queue = tf.train.string_input_producer([os.path.dirname(os.path.abspath(sys.argv[0])) + "/" + file_name])
    
    reader = tf.TextLineReader(skip_header_lines=1)
    key, value = reader.read(filename_queue)
    
    decoded = tf.decode_csv(value, record_defaults=record_defaults)
    return tf.train.shuffle_batch(decoded, 
                                  batch_size=batch_size, 
                                  capacity=batch_size*50, 
                                  min_after_dequeue=batch_size)

def inputs():
    sepal_length, sepal_width, petal_length, petal_width, label = \
    read_csv(100, "iris.data", [[0.0], [0.0], [0.0], [0.0], [""]])

    label_number = tf.to_int32(tf.argmax(tf.to_int32(tf.stack([
        tf.equal(label, ["Iris-setosa"]),
        tf.equal(label, ["Iris-versicolor"]),
        tf.equal(label, ["Iris-virginica"]),
    ]))))
    print(sepal_length)
    
    features = tf.transpose(tf.stack([sepal_length, sepal_width, petal_length, petal_width]))
    return features, label_number
def train(total_loss):
    learning_rate = 0.01
    return tf.train.GradientDescentOptimizer(learning_rate).minimize(total_loss)

def evaluate(sess, X, Y):
    predicted = tf.cast(tf.arg_max(inference(X), 1), tf.float32)
    print sess.run(tf.reduce_mean(tf.cast(tf.equal(predicted, Y), tf.float32)))
with tf.Session() as sess:
    tf.initialize_all_variables().run()
    X, Y = inputs()
    
    total_loss = loss(X, Y)
    train_op = train(total_loss)
    
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
    
    training_steps = 1000
    for step in range(training_steps):
        sess.run([train_op])
        if step % 10 == 0:
            print "loss: ", sess.run([total_loss])
    evaluate(sess, X, Y)
    
    import time
    time.sleep(5)
    
    coord.request_stop()
    coord.join(threads)
    sess.close()

6、多層神經網路

線性迴歸模型和對數機率迴歸模型本質上多是單個神經元，輸入加權和，啟用函式（恆等式或sigmoid）

對於softmax分類，為含C個神經元的網路

異或運算的網路

7、梯度下降法與誤差反向傳播演算法

尋找損失函式的極值點。用tf.gradients方法

BP是一種高效計算資料流圖中梯度的技術

面向機器智慧的TensorFlow實戰2：TensorFlow基礎
2018-05-24
面向機器智慧的TensorFlow實戰1：安裝
2018-05-24
面向機器智慧的TensorFlow實戰7：詞向量嵌入
2018-05-26
面向機器智慧的TensorFlow實戰8：序列分類
2018-05-26
《機器學習實戰》第一章機器學習基礎
2018-11-25
機器學習
TensorFlow系列專題（二）：機器學習基礎
2018-11-05
機器學習
TensorFlow系列專題（一）：機器學習基礎
2018-11-05
機器學習
面向機器智慧的TensorFlow實戰5：目標識別與分類
2018-05-26
《機器學習實戰》-01機器學習基礎 #win8-anaconda prompt配置jupyter notebook
2018-12-07
機器學習
Scikit-Learn 與 TensorFlow 機器學習實用指南學習筆記1 — 機器學習基礎知識簡介
2018-11-20
機器學習筆記
Scikit-Learn 與 TensorFlow 機器學習實用指南學習筆記2 — 機器學習的主要挑戰
2018-11-26
機器學習筆記
TensorFlow釋出面向JavaScript開發者的機器學習框架TensorFlow.js
2019-03-03
JavaScript機器學習框架JS
JavaScript玩轉機器學習-Tensorflow.js專案實戰
2020-12-29
JavaScript機器學習JS
機器學習基礎——整合學習1
2021-03-16
機器學習
ML-機器學習基礎
2019-02-27
機器學習
【機器學習基礎】——梯度下降
2021-10-12
機器學習梯度
機器學習基礎總結
2023-02-07
機器學習
基於Sklearn機器學習程式碼實戰
2022-11-25
機器學習
面向機器智慧的TensorFlow實戰6：迴圈神經網路與自然語言處理
2018-05-26
神經網路自然語言處理
《機器學習實戰》學習大綱
2018-12-01
機器學習
機器學習-4
2018-04-16
機器學習
InterPSS ：基於 TensorFlow 的電力系統分析機器學習
2022-03-11
機器學習
InterPSS ：基於TensorFlow的電力系統分析機器學習
2022-03-11
機器學習
python機器學習實戰（二）
2018-12-26
Python機器學習
機器學習基礎知識1
2020-10-24
機器學習
機器學習基礎04DAY
2023-03-25
機器學習
機器學習基礎09DAY
2023-03-31
機器學習
機器學習基礎05DAY
2023-03-26
機器學習
機器學習開發流程基礎
2021-04-22
機器學習
【機器學習基礎】關於深度學習的Tips
2021-11-12
機器學習深度學習
【機器學習基礎】神經網路/深度學習基礎
2021-11-05
機器學習神經網路深度學習
面向機器學習的特徵工程一、引言
2018-06-21
機器學習特徵工程
機器學習基礎專題：支援向量機SVM
2020-10-18
機器學習
圖解機器學* | 機器學*基礎知識
2022-03-09
圖解
TensorFlow Hub：探索機器學習元件化
2018-12-13
機器學習元件化
機器學習基礎-資料降維
2019-05-02
機器學習
機器學習基礎——規則化（Regularization）
2021-01-30
機器學習
基於 KubeVela 的機器學習實踐
2022-04-07
機器學習