關於《自然語言處理入門》的反饋意見,作者何晗說明如下
《自然語言處理入門》是圖靈 2019 年 10 月出版的一本 NLP 領域的入門圖書,作者是何晗(網名 hankcs,HanLP 作者、「碼農場」部落格博主)。圖書上架之後得到了廣大的讀者的喜愛,在短短半年內,已經印刷了 6 次,總印數為 14 000。與此同時,這本書目前已經被三十多所學校的教師或者研究團隊作為參考教材,或者大公司的 NLP 團隊作為交流參考資料。不誇張地說,這本書在某種程度上滿足了一大批讀者的訴求,而此前圖書市場上並沒有圖書做到這一點。
我們收到過很多朋友的致謝,非常榮幸這本書對這部分讀者幫助如此之大。我們也收到過一些朋友三三兩兩的意見,反饋這本書在某些方面並沒有達到他們的期望,非常感謝這些反饋和建議。大家的需求如此多樣,而我們的書只能定位解決其中的一兩個問題,更多問題,只能寄希望於出版更多圖書。
但是,還有一小撮讀者對這本書有一定的誤解,甚至有讀者買來圖書都沒有好好閱讀就跑去豆瓣評了一星(這本書目前在豆瓣的評分是 8.8 分),大家知道,對於辛苦寫作的作者和認真出版的出版方來說,這樣的評論很扎心,也很無奈,因為你沒辦法跟做出這種行為的讀者講理——你想通過大家的意見認真提升圖書品質,而他只不過是靠膚淺的認知隨意過把嘴癮。我能這麼提這個問題是因為我試著按圖索驥找到過其中兩位讀者諮詢他們的意見,結果,你可能猜到了,他們甚至沒有認真讀過書,對於自己的“惡毒”評論也沒說出個所以然來。
我也想借此提醒諸君,在豆瓣或者大眾點評等網站上,儘量客觀表達你的使用體驗,如果能夠做到有理有據那就更好了,這是為數不多能體現我們普通人影響力的地方。
書無完書,也不可能滿足所有讀者的閱讀需求,只希望真正需要這這本書人都能找到這本書。
好了,說這麼多,其實這篇文章的核心是為部分對《自然語言處理入門》有些許誤解或者過度期待的讀者簡單解釋一下,我原文轉載了作者何晗的說明,請見如下。
各位讀者大家好:
在大家的支援下,拙作《自然語言處理入門》 取得了些許成績,包括印數、繁體中文版企劃等,謝謝你們。
在讀者群壯大的同時,我也收到了許多反饋。勘誤類的反饋我在 《自然語言處理入門》勘誤表 中一一答覆並致謝。但一些兩極化的評論也引發了我的一些擔憂,在此我做一個統一的澄清。取決於讀者自身的基礎,產生了如下幾種觀點,我認為是不妥當的。
搞NLP只需看《自然語言處理入門》 就夠了,比某某教材好
只看一本書肯定是不夠的,拿《自然語言處理入門》 跟經典教材比也是不恰當的,拙作無意也無法取代經典教材。拙作定位是面向零基礎讀者的入門讀物,相當於科普而非專著。專著中的定義、理論、推導證明等對零基礎讀者而言太難了。就入門而言,最重要的是興趣而不是難度,所以讀者看到的是一個通俗易懂的定位。同時,對有難度的部分,書裡也有對專著的引用,請有志於深造的讀者遞迴學習。
《自然語言處理入門》 不夠深入,理論性不強
這一點還是取決於讀者自身的基礎。事實上,關於拙作究竟是太難了還是太簡單了這一點,我聽到了許多截然相反的評價。有ML或數理基礎的讀者傾向於認為拙作太簡單,而部分一點數學都接受不了的讀者則認為拙作太難。我誠懇地建議,NLP是ML的應用層,既不要過高地期待NLP入門書會深入ML理論的核心,也不要連ML的皮毛都畏難抗拒。正如介紹語所言,拙作僅允許必需的公式出現。拙作既沒有寫成ML和NLP的並集,也沒有寫成NLP與ML的差集,個人認為是符合入門的定位的。
《自然語言處理入門》 沒怎麼講深度學習
慚愧,第十三章一定沒有滿足這部分讀者。然而,深度學習是無論如何都不可能通過一章就講清楚。數一數的話,線性代數基礎需要一章、優化理論需要一章、詞的分佈表示需要一章、CNN/RNN/Transformer各需要一章、《自然語言處理入門》 1中涉及到的各種NLP任務各需要一章。基本上,CS224n有多少節課相應就需要多少章,這些章節加起來又是一本書了。另一方面,將這些內容加入到入門書裡並不恰當。正如我在第一章所說,深度學習不是所有場景都適用,也不是所有企業都用得起深度學習,掌握傳統機器學習有助於理解深度學習。深度學習有泡沫成分,本身也是一個理論不完備的領域,初學者不必急於求成。
《自然語言處理入門》 講了很多HanLP的內容
這在部分讀者看來是好事,在另一部分讀者看來是缺點。理論是通用的,實現只選取一種。作為入門書,我覺得有責任提供正確實現還能用到生產專案裡的程式碼。我在前言和試讀中都有提到,自己寫的程式碼自己講得清楚,所以書裡講到HanLP的設計和實現是理所當然的事情。
總之,讀者自我定位和本書的定位是否匹配非常重要,不必跟風購買。千言萬語,總結為一句話,定位就是入門,不要抱有過度的期待。有任何批評和建議,儘管留言或私信。同時,方便的話,歡迎讀者朋友去豆瓣留下公正的書評。
相關文章
- 自然語言處理入門 - olay自然語言處理
- NLP漢語自然語言處理入門基礎知識自然語言處理
- 自然語言處理入門基礎之hanlp詳解自然語言處理HanLP
- NLP漢語自然語言處理入門基礎知識介紹自然語言處理
- Hanlp自然語言處理中的詞典格式說明HanLP自然語言處理
- 突破!自然語言強化學習(NLRL):一個可處理語言反饋的強化學習框架強化學習框架
- 自然語言處理NLP快速入門自然語言處理
- 自然語言處理怎麼最快入門?自然語言處理
- CCAI 2020 | 周明:自然語言處理大有可為AI自然語言處理
- 自然語言處理(NLP)系列(一)——自然語言理解(NLU)自然語言處理
- vue+cube 評價/意見反饋頁面Vue
- 自然語言處理頂會 ACL 2018 參會見聞自然語言處理
- 入門自然語言處理必看:圖解詞向量自然語言處理圖解
- 自然語言處理NLP(四)自然語言處理
- 自然語言處理(NLP)概述自然語言處理
- Python自然語言處理工具Python自然語言處理
- HanLP 自然語言處理 for nodejsHanLP自然語言處理NodeJS
- 自然語言處理的最佳實踐自然語言處理
- 解決ipa上傳反饋info.plist相關用途字串說明問題字串
- 2023nlp影片教程大全 NLP自然語言處理教程 自然語言處理NLP從入門到專案實戰自然語言處理
- 自然語言處理中的語言模型預訓練方法自然語言處理模型
- 語音訊號處理入門系列(2)——訊號處理中的幾個關鍵概念音訊
- [譯] 自然語言處理真是有趣!自然語言處理
- 自然語言處理:分詞方法自然語言處理分詞
- Python 自然語言處理(基於jieba分詞和NLTK)Python自然語言處理Jieba分詞
- [BUG反饋]關於設定選單的BUG
- 自然語言處理之:搭建基於HanLP的開發環境自然語言處理HanLP開發環境
- Pytext 簡介——Facebook 基於 PyTorch 的自然語言處理 (NLP) 框架PyTorch自然語言處理框架
- 用於自然語言處理的迴圈神經網路RNN自然語言處理神經網路RNN
- ITPUB部落格新版本上線啦,意見反饋收集!
- 關於 Jupyter 的使用說明
- 探索自然語言處理:語言模型的發展與應用自然語言處理模型
- 精通Python自然語言處理 2 :統計語言建模Python自然語言處理
- FFmpeg 影片處理入門教程
- GitHub專案:自然語言處理專案的相關乾貨整理Github自然語言處理
- 配置Hanlp自然語言處理進階HanLP自然語言處理
- 自然語言處理之jieba分詞自然語言處理Jieba分詞
- 人工智慧 (06) 自然語言處理人工智慧自然語言處理