要啥給啥的寫作AI：新聞評論小說能編，題材風格隨便選，真假難辨

AIBigbull2050發表於2019-09-13

原文網址 : http://blog.itpub.net/69946223/viewspace-2656963/

AI編故事，一模更比一模秀。

這裡“一模”，自然是OpenAI橫空出世的GPT-2。但今日更秀的另一模型，來自Salesforce——全球最大的SaaS提供商，雖然之前AI能力展露不多，但這一次，絕對一鳴驚人。

作家知道會沉默，評論水軍看了要流淚。因為定向化編故事、生成文案評論的能力，實在太強了！

話不多說，直接看“作品”。

定向化編故事，真假難辨

給它一把刀，它編出了這樣的“恐怖故事”：

刀柄從洞裡拔了出來。當刀擊中我時，我嚇了一跳，驚恐地睜大了眼睛。除了嗚咽聲，我只聽到她的尖叫聲。

蜘蛛準備挖她上面的拱頂時，碰到了她的腳，小傢伙的眼淚開始流下來。蜘蛛抬頭看著她，回望著我，眼裡充滿了熱淚。我的心開始狂跳……

有情景、有邏輯、有細節，還有故事性，寫作功力簡直職業作家水平。

還能編出“買家好評”：

刀是一種工具，這個很好用。這是我買給我丈夫的。他拿到它們之後就一直用它們來切肉。

他說它們很鋒利，所以使用時要小心，但這似乎不是什麼大問題。從雞胸肉到牛裡脊肉，他都切過……

相比無腦好評的水軍，AI給出的結果很難想象是機器寫的，核心資訊點、細節，全都有了。

但寫得好、寫得真假難辨，還不是重點！

更關鍵的是，這個模型的獨特之處——只需要給出條件，它就能“定向”編故事，寫命題作文，指哪打哪，想寫什麼風格就寫什麼風格。

與腦洞過於天馬行空的GPT-2相比，它更能夠被人馴服利用。

於是模型放出後，很快就引起了業內人士的關注。也有人給出評價：

這太酷了！能夠以更結構化的方式控制文字生成非常有價值。

而且，這個NLP模型具有16億引數，比之前最大的GPT-2還要多一個億。

雖然同樣擔心模型被濫用，但在研究人員看來，開放可能會更好，能讓更多的人蔘與進來，一起抵抗。

所以，他們直接在GitHub上放出了多個全尺寸的、經過訓練的 CTRL 版本。而不是像GPT-2一樣，擠牙膏開源。

而且，它還是個全能選手，不僅能編故事，比如在Reddit論壇健身、理財板塊發表不同的評論。

它還有很多正經用途：編寫維基百科詞條、回答各類常識問題、翻譯文字等等。

那麼這是一個怎樣的NLP模型？

16億引數的語言模型

這個模型，有一個非常有“靈性”的名字： CTRL，全稱為Conditional Transformer Language，基於條件的Transformer語言模型。

自從有了Transformer，文字生成領域的大前輩就一個接著一個，這廂BERT開創先河，那廂GPT-2都能寫論文了。

但是，與人類的創作方法不同，生成的文字再以假亂真，語言模型前輩們也不能按照特定的主題來寫作內容。

於是，CTRL誕生了。

這是一個擁有多達 16億引數的條件Transformer語言模型（GPT-2模型引數15億），採用無監督學習，並且正如其名，能夠對文字生成的內容進行更精準的控制。

比如給出一個商品評分：1.0。

GPT-2生成的內容是這樣的：

而CTRL，會生成這樣的結果：

我為我兒子買了這個，他是這個節目的忠實粉絲。在拿到它之前，他非常期待。但當他開啟它時，我們都非常失望。產品質量太差了。它看起來就像是一元店裡的東西。

這玩意兒狀況很差。前蓋上有幾處劃痕以及其他一些輕微磨損……

實現的關鍵，在於控制程式碼（control codes）。

CTRL以控制程式碼c為條件，學習分佈 p ( x | c )。這一分佈可以用概率鏈規則分解，並通過考慮控制程式碼的損失來進行訓練。

控制程式碼能使使用者意圖為語言模型所理解。

通過標註訓練資料集的特定標籤，CTRL模型中大部分控制程式碼能指定生成文字的整體樣式。

即使給出的提示（prompt）相同，控制程式碼也允許生成多樣化的內容。並且，就算不給提示，CTRL一樣能生成特定風格的文字。

△在有控制程式碼的情況下，開頭也不用給

而將控制程式碼新增到標籤程式碼中，可以進一步限制生成。

比如在OpenWebText版本中，在每一個文件後面加入URL地址，作為輸入序列的開頭。

這樣，CTRL在訓練過程中，就會學習這些URL的結構和文字之間的關係。在推理過程中，URL可以指定各種功能，包括域，子域，實體，實體關係，乃至日期。

除此之外，還有一小部分控制程式碼是與問答、翻譯這樣的特定任務相關的。這些控制程式碼相對複雜。

好玩的是，混合控制程式碼會產生一些有意思的文字。

比如把翻譯控制程式碼混合到飲食這個標籤中，生成的文字就擁有了兩種不同語言的版本：

再比如說把政治和法語提示混到一起：

這些組合，在此前的訓練中都沒有出現過。

值得一提的是，CTRL的訓練文字資料多達140GB，包括維基百科，Gutenberg上的書籍，OpenWebText2資料集（GPT-2網頁文字資料集克隆版），大量新聞資料集，亞馬遜評價，來自ELI5的問答，以及包括史丹佛問答資料集在內的MRQA共享任務等等等等。

資料集雖然沒有開源，但Salesforce表示，他們會發布與資料收集相關的程式碼。

以及，由於控制程式碼和用於訓練模型的文字之間存在直接關係，CTRL能判斷出新文字生成時對其影響最大的資料來源是哪一個。

全球最大的SaaS服務提供商出品

這篇論文來自 Salesforce——全球最大的SaaS服務提供商。

最近最為人關注的是一次大規模商業併購：豪擲157億美元收購大資料公司Tableau。

Salesforce Research是其內部的研究部門，核心目標是用AI來解決業務中的問題，已經在NLP領域頗有建樹。

目前，這一部門由Salesforce的首席科學家Richard Socher領導。

他博士畢業於史丹佛大學計算機系。2016年，自己創辦的公司被Salesforce收購後，加入Salesforce。

根據他個人網站資訊，僅在2019年他就釋出了11篇頂會論文，其中ACL 2019 3篇；ICLR 2019 6篇；CVPR 2019 1篇；ICML 2019 3篇。

他也是這篇論文的作者之一。這篇論文的其他作者，都是Salesforce Research的研究員。第一作者有兩位，分別是Nitish Shirish Keskar和Bryan McCann。

其中，Nitish Shirish Keskar是Salesforce的高階研究員，博士畢業於西北大學，研究方向為深度學習及其在自然語言處理和計算機視覺方面的應用。他的個人頁面顯示，已經發表了14篇論文，其中不乏ICLR等頂會。

Bryan McCann也是Salesforce高階研究員，畢業於史丹佛大學，曾經擔任過吳恩達機器學習課程的助理，研究方向是深度學習及其在自然語言處理方面的應用。個人網站顯示，他發表過7篇論文，不乏ACL、NeurIPS、EMNLP等AI頂會。

引發引數熱議

這一研究成果，也引起了大家對模型引數的討論。

有人說，15億引數也好，16億引數也罷，要是英偉達的Megatron放出來，80億引數肯定都通通碾壓。

但也有人給出冷思考，表示引數很多並不是優點，而是一個弱點。阿姆斯特丹大學的助理教授Willem Zuidema說：

為什麼規模大是一個賣點？我理解人們為建立了一個非常好的模型而自豪，甚至為找到了在有限的計算資源上訓練大型模型的方法而自豪。

但在我看來，16億引數本身似乎是一個弱點，而不是優勢。

對此，Richard Socher也給出了回應：

確實，假設效能相同，較小的模型更好。但事實證明，只要你在大量的訓練資料上訓練它，語言模型的效能和記憶事實的能力與大小是密切相關的。

Jelle Zuidema再度回應，給出了進一步的解釋：

令我驚訝的是，“最大”是宣告中的第一個形容詞，而“高質量”只是最後一點。

我認為有必要提醒人們，理想的方法仍然是更少的引數、更少的培訓和更好的效能。

你怎麼看？

傳送門

最後，如果你對這個研究感興趣，請收好傳送門：

專案地址：

https://github.com/salesforce/ctrl

論文地址：

https://einstein.ai/presentations/ctrl.pdf

部落格文章：

https://blog.einstein.ai/introducing-a-conditional-transformer-language-model-for-controllable-generation/

— 完 —

https://www.toutiao.com/a6735641978853130763/

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/69946223/viewspace-2656963/，如需轉載，請註明出處，否則將追究法律責任。

BA都在忙些啥 - 寫給新人的BA工作說明書
2019-04-08
把「中國風」交給老外，能折騰出啥遊戲？
2020-07-08
遊戲
釣魚郵件真假難辨？幾招教你如何辨別
2019-12-17
公司要給大家更改交社保的公司，這個是啥情況，過來人來說說
2024-08-29
隨便寫
2024-07-25
AI在用 | 用ChatGPT、Kimi克隆自己的寫作風格
2024-03-21
AIChatGPT
mysql索引為啥要選擇B+樹 (下)
2019-03-17
MySql索引
mysql索引為啥要選擇B+樹 (上)
2019-03-09
MySql索引
Ubuntu linux 為啥要開始選擇ubuntu LINUX
2023-02-22
UbuntuLinux
Nginx的mirror指令能幹啥？
2022-05-11
Nginx
自己動手，豐衣足食：從零開始寫個 IDEA 外掛，要啥功能就做啥
2020-09-25
Idea
啥啥啥，服務治理是個啥
2021-02-01
面試 (MySQL 索引為啥要選擇 B+ 樹)
2019-03-21
面試MySql索引
瞭解這幾招耗材真假您也能輕鬆辨別！
2018-06-30
智慧寫作新體驗：AI寫作小助手助力內容創作
2024-09-21
AI
我們正在被 DDoS 攻擊，但是我們啥也不幹，隨便攻擊...
2024-03-31
軟體編寫風格
2018-10-27
新媒體編輯要做啥工作？新媒體初學
2020-01-17
想學Java要啥基礎？
2021-09-18
Java
部落格園小編，請給我一個說法 20210315
2021-03-15
給女朋友講ActiveMQ是啥？
2019-08-20
MQ
高難度畫素風格動作遊戲引薦與評價
2021-01-07
遊戲
我在京東做研發丨“真假難辨”的數字人是如何合成的？
2023-05-18
AIGC能幫DBA做點啥
2023-11-28
AIGC
你說寫程式碼，最常用的3個設計模式是啥？
2022-05-18
設計模式
中文寫作排版風格指南
2021-01-13
「譯」懂點那啥編譯
2020-06-15
編譯
JS 編譯器都做了啥？
2019-01-02
JS編譯
【Spring淺析】一、 BeanFactory 有啥可說的？
2021-05-16
SpringBean
久違的更新，隨便寫一點
2024-11-03
給ITPub部落格小編的幾句話
2018-08-04
ES 不香嗎，為啥還要 ClickHouse？
2023-04-20
實體類為啥要序列化
2024-06-05
為啥要繼承一個空介面
2022-04-01
繼承
讀阿里人如何寫週報一文後,想說點啥
2020-03-20
阿里
Linux作業系統好學嗎？Linux運維要先學些啥？
2019-12-26
Linux作業系統運維
Python是啥呢？能拿來幹嘛？
2021-08-21
Python
新客為啥留不住？只因你沒有掌握復購分析的方法論
2021-08-31

要啥給啥的寫作AI：新聞評論小說能編，題材風格隨便選，真假難辨

相關文章