“狗屁不通文章生成器”登頂GitHub熱榜,分分鐘寫出萬字形式主義大作

十步殺一人_千里不留行發表於2020-01-11

一、垃圾文字生成器介紹

最近在瀏覽GitHub的時候,發現了這樣一個骨骼清奇的雷人專案,而且熱度還特別高。

  • 專案中文名:狗屁不通文章生成器
  • 專案英文名:BullshitGenerator

根據作者的介紹,他是偶爾需要一些中文文字用於GUI開發時測試文字渲染,因此開發了這個廢話生成器。但由於生成的廢話實在是太過富於哲理,所以最近已經被小夥伴們給玩壞了。

他的文風可能是這樣的:

你發現,引經據典,頭頭是道,說好的狗屁不通在哪裡呢?

還有這樣的:

而且,同一個主題,每次點選生成,都會出現完全不同的文字。

二、垃圾文字生成器的來歷

垃圾文字生成器的來歷也很有意思,據作者說,最開始源於他在逛知乎的時候,發現有網友在退出學生會的時候,需要寫6000字的退會申請。因為作者以前挺擅長寫這類“狗屁不通”的文章。結果寫了幾句,突然想到還是寫個程式生成吧。於是,狗屁不通文字生成器就誕生了。

目前,由於專案過於火爆,有一位同學,把生成器移植到了telegram上,獲得了一隻充滿哲思的機器人。

當被問及“今天中午吃什麼”這樣一個世紀難題的時候,機器人回覆了整整兩螢幕資訊:

也有一些同學,則致力於把這個專案推向國際。於是,英文版和日本版就誕生了。

還有些同學,開發出了手寫體版本:

三、狗屁不通文章生成器是怎麼實現的?

簡單翻了一下原始碼,真的是特別簡單,一點簡單的廢話語料庫,一點字串拼接語句就生成了華麗麗的幾千字,我們來欣賞一下原始碼:

名人名言廢話語料庫,167行程式碼,這個只要新增更多的廢話,就能生成更豐富的內容:

js版本生成演算法:

function 生成文章(){
    主題 = $('input').value
    let 文章 = []
    for(let 空 in 主題){
        let 章節 = "";
        let 章節長度 = 0;
        while( 章節長度 < 6000 ){
            let 隨機數 = 隨便取一個數();
            if(隨機數 < 5 && 章節.length > 200){
                章節 = 增加段落(章節);
                文章.push(章節); 
                章節 = "";
            }else if(隨機數 < 20){
                let 句子 = 來點名人名言();
                章節長度 = 章節長度 + 句子.length;
                章節 = 章節 + 句子;
            }else{
                let 句子 = 來點論述();
                章節長度 = 章節長度 + 句子.length;
                章節 = 章節 + 句子;
            }
        }
        章節 = 增加段落(章節);
        文章.push(章節);
    }
    let 排版 = "<div>" + 文章.join("</div><div>") + "</div>";
    $("#論文").innerHTML = 排版;
}

py版本:

if __name__ == "__main__":
    xx = input("請輸入文章主題:")
    for x in xx:
        tmp = str()
        while ( len(tmp) < 6000 ) :
            分支 = random.randint(0,100)
            if 分支 < 5:
                tmp += 另起一段()
            elif 分支 < 20 :
                tmp += 來點名人名言()
            else:
                tmp += next(下一句廢話)
        tmp = tmp.replace("x",xx)
        print(tmp)

可以看出,沒有用任何高階技術,不取巧,作者宣告如下:

鄙人才疏學淺並不會任何自然語言處理相關演算法. 而且目前比較偏愛簡單有效的方式達到目的方式. 除非撞到了天花板, 否則暫時不會引入任何神經網路等演算法. 不過歡迎任何人另開分支實現更復雜, 效果更好的演算法. 不過除非效果拔群, 否則鄙人暫時不會融合.

這個文字細細讀起來,還是挺有哲理的。

額,其實就是一本正經地說廢話的那種感覺。你懂的。。。

四、最後,放上鍊接

狗屁不通文章生成器:
https://github.com/menzi11/BullshitGenerator

網頁版:
https://suulnnka.github.io/BullshitGenerator/index.html


我的微信公眾號:架構真經(id:gentoo666),分享Java乾貨,高併發程式設計,熱門技術教程,微服務及分散式技術,架構設計,區塊鏈技術,人工智慧,大資料,Java面試題,以及前沿熱門資訊等。每日更新哦!

相關文章