人工智慧PK高鶚，續寫《紅樓夢》

楊天超發表於2021-01-01

原文網址 : https://blog.csdn.net/gaobing1993/article/details/111562715

人工智慧

1.前言

既然曹老爺子的後四十回丟了，那麼對於每個熱愛她的人來說，續寫紅樓都是一件讓人熱血沸騰的事兒。正好最近不是很忙，作為一個自然語言處理的小學生，我大膽嘗試著使用人工智慧來實現我的願望。

2.環境準備

1.整體模型使用T1080 訓練了10分鐘左右，當然是一個比較簡單的模型
2.框架使用tensorflow2.1版本

3.程式碼

使用方式，給定第一個字，自動生成固定長度的文字。

import tensorflow as tf
import numpy as np
import os
import time
text = open('honglou.txt','r',encoding='gb18030').read()
vocab = sorted(set(text))
char2idx = {u:i for i,u in enumerate(vocab)}
text_as_int = np.array([char2idx[t] for t in text])
char_dataset = tf.data.Dataset.from_tensor_slices(text_as_int)
seq_length = 100
sequences = char_dataset.batch(seq_length+1,drop_remainder=True)

def split_input_target(chunk):
input_text = chunk[:-1]
target_text = chunk[1:]
return input_text,target_text
dataset = sequences.map(split_input_target)
BATCH_SIZE = 64
dataset = dataset.shuffle(1000).batch(BATCH_SIZE,drop_remainder=True)

#詞集的長度
vocab_size = len(vocab)
#嵌入的維度
embedding_dim = 256
#RNN 的單元數量
rnn_units = 1024
def build_model(vocab_size, embedding_dim, rnn_units, batch_size):
model = tf.keras.Sequential([
tf.keras.layers.Embedding(vocab_size, embedding_dim,
batch_input_shape=[batch_size, None]),
tf.keras.layers.GRU(rnn_units,
return_sequences=True,
stateful=True,
recurrent_initializer=‘glorot_uniform’),
tf.keras.layers.Dense(vocab_size)
])
return model
model = build_model(vocab_size = len(vocab),embedding_dim=embedding_dim,rnn_units=rnn_units,batch_size=BATCH_SIZE)

for input_example_batch, target_example_batch in dataset.take(1):
example_batch_predictions = model(input_example_batch)
def loss(labels, logits):
return tf.keras.losses.sparse_categorical_crossentropy(labels, logits, from_logits=True)
example_batch_loss = loss(target_example_batch, example_batch_predictions)
model.compile(optimizer=‘adam’, loss=loss)

#檢查點儲存至的目錄
checkpoint_dir = ‘./training_checkpoints’
#檢查點的檔名
checkpoint_prefix = os.path.join(checkpoint_dir, “ckpt_{epoch}”)
checkpoint_callback=tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_prefix,save_weights_only=True)

EPOCHS = 150
model.fit(dataset,epochs=EPOCHS,callbacks=[checkpoint_callback])

#使用模型
tf.train.latest_checkpoint(checkpoint_dir)
model = build_model(vocab_size,embedding_dim,rnn_units,1)
model.load_weights(tf.train.latest_checkpoint(checkpoint_dir))
model.build(tf.TensorShape([1, None]))

def generate_text(model, start_string):

評估步驟（用學習過的模型生成文字）

要生成的字元個數

num_generate = 1000

將起始字串轉換為數字（向量化）

input_eval = [char2idx[s] for s in start_string]
input_eval = tf.expand_dims(input_eval, 0)

空字串用於儲存結果

text_generated = []

低溫度會生成更可預測的文字

較高溫度會生成更令人驚訝的文字

可以通過試驗以找到最好的設定

temperature = 1.0

這裡批大小為 1

model.reset_states()
idx2char = np.array(vocab)
for i in range(num_generate):
predictions = model(input_eval)
# 刪除批次的維度
predictions = tf.squeeze(predictions, 0)

  # 用分類分佈預測模型返回的字元
  predictions = predictions / temperature
  predicted_id = tf.random.categorical(predictions, num_samples=1)[-1,0].numpy()

  # 把預測字元和前面的隱藏狀態一起傳遞給模型作為下一個輸入
  input_eval = tf.expand_dims([predicted_id], 0)
 
  text_generated.append(idx2char[predicted_id])

return (start_string + ‘’.join(text_generated))
print(generate_text(model, start_string=u"話說金桂聽了"))

4.我的一天

我去使用飲水機打水，剛開始的時候水杯發出的聲音很大，一度會擔心吵到別人。隨著杯子中水量的增加，聲音越來越小，直到最後聽不見，我就將水關掉了。這就是人們常說的滿瓶不響半瓶響吧！是說一個人沒有什麼水平的時候，總是表現的特別高調，等到這個人成熟了，見過大的世面，就懂得謙遜和低調。可是我不禁的去想，為什麼我們總是在空瓶的時候，希望它的聲音小一點。對於不成熟的人，高調不是一件很正常的事情嗎？既然大自然不嫌棄會響的空瓶，我們有什麼資格嫌棄那些不成熟的人呢？這種嫌棄的心才是真的應該被嫌棄的吧！算了，不想了，繼續努力工作吧！在我工作的累的時候，我就聽會兒個放鬆一下。這時候突然想起了一個農民，大熱的天他在田地裡辛苦的勞動，這時候也累了找個樹蔭處休息休息，吹吹風。再看看我的四周，我還真是羨慕那個農民。突然間覺得土地無比的親切，我想家了，想回到自己出生的地方去，聽聽田裡蟋蟀的聲音。

愣著幹什麼？進來選老婆!

《紅樓夢》中的宗教信仰
2019-03-03
論《紅樓夢》中的詩詞曲賦
2018-12-05
Google BERT中文應用之《紅樓夢》對話人物提取
2019-02-18
Go
一朝入夢，終生不醒：再看紅樓夢，也談石頭記
2018-05-19
安利一個驚豔的紅樓夢視覺化作品
2018-09-14
視覺化
【揭祕】紅樓夢後四十回到底是誰寫的？機器學習告訴你
2018-04-18
機器學習
盤點1987年版《紅樓夢》金陵十二釵正冊女子
2018-12-19
機器學習之紅樓夢作者判斷(貝葉斯分類)
2018-05-27
機器學習
基於《紅樓夢·元春省親》測試GraphRAG的問答效果
2024-07-26
紅樓十二曲(二)
2024-05-12
寶付續寫Python人工智慧
2019-08-29
Python人工智慧
從“同人奇蹟”到《紅樓夢》和AVG遊戲有關的那些事
2019-12-02
遊戲
《紅樓夢》人物關係有多複雜？一張圖幫你理清楚！
2020-12-27
人工智慧之夢
2020-04-07
人工智慧
改編不是亂編：我們是如何在遊戲中還原《紅樓夢》經典場景的
2024-03-19
遊戲
高力國際：成都天府新區寫字樓專題研究（附下載）
2020-11-24
延續高迪的夢境：華為筆下的“智慧城市”畫卷
2019-11-22
攻略《紅樓夢》裡的十二釵，可能是一代人對國產黃油最後的回憶
2020-06-18
CBRE： 2020上海寫字樓租戶普查
2020-11-25
解密美國五角大樓人工智慧中心
2018-08-13
解密人工智慧
《夢工廠大冒險》今日不刪檔開啟，《功夫熊貓》傳奇續寫！
2020-04-29
中關村區域規劃及寫字樓現狀之——中關村寫字樓市場現狀
2020-06-12
中關村
小霸王擬上市主體人去樓空，500億市值夢擱淺？
2019-05-27
京東前端二面高頻手寫面試題（持續更新中）
2023-03-06
前端面試題
如何利用TRIZ改善高層樓房的佈局？
2022-11-08
心歸位夢起航三七互娛研發中心大樓正式啟用
2021-04-20
NS《海市蜃樓之館-遊魂歸夢-》中文版今日開啟預購
2022-12-08
樓市提振政策持續釋放，二線城市限購放鬆
2023-04-09
人工智慧的浪潮還能持續多久？
2019-07-02
人工智慧
vuejs元件庫pk介紹
2019-04-16
VueJS元件
北京pk賽車帶回血，北京pk10有回血成功的嗎
2018-12-08
資料保障更上一層樓紅塔證券與新華三做了這件事
2020-06-11
四大名著只有兩個遊戲IP，紅樓水滸真不行嗎？
2021-06-09
遊戲
離開 CGI，FastCGI，PHP-FPM 談高可用挺空中樓閣的！
2019-08-01
ASTPHP
萬丈高樓平地起，撥開技術神祕的面紗
2021-12-10
【公益譯文】五角大樓高階領導備忘錄
2021-08-31
CBRE：2022年成都甲級寫字樓租戶普查
2022-11-24
KV上MySQL與Redis的PK
2021-12-11
MySqlRedis