ChatGPT會對我們日常生活帶來什麼影響?這些技術會改變我們學習閱讀工作方式嗎?
AI 這個話題很火,我也一直在關注著,很多人甚至覺得 AI 會改變世界,也許你會好奇:ChatGPT 會在三年內終結程式設計嗎?AI有可能改變人的學習方式嗎?AI 能否取代打工人?本文會對相關問題從我們可見日常問題進行解答。
1.AI有可能改變人的閱讀方式嗎?
希望從:AI 輔助提高了人的閱讀效率嗎、AI能幫助人更好地瞭解和記憶書中的內容嗎、AI 技術有可能改變人的閱讀方式嗎三個方面進行解答。並用 AI 工具進行輔助閱讀,甚至只用 AI 工具閱讀,同時我會分享我用到的工具和方法。
1.1ChatDoc小試牛刀
- ChatDoc:準確性比較高這個工具使用起來比較簡單。你可以將 PDF 書籍上傳到 ChatPDF,然後它會建立書籍索引,接著你就可以像聊天那樣,問書籍的細節內容,或者讓 AI 幫忙總結書中的內容。
- Bing :Bing 不支援訪問本地的 PDF,如果你的書籍或者論文是線上版本的,可以直接用 Edge(Dev 版本)的側邊欄調出 Bing Chat,讓其總結 PDF 內容:
相關資料連結:
-
GPT-4 論文(英文內容)
-
《Mental Models》(英文內容)
-
《長壽-當人類不再衰老》(中文內容)
透過多次使用,我就遇到了兩個非常嚴重的問題:內容錯誤和對話式學習。
先說下內容錯誤,拿 Mental Models 這本書為例,我讓它羅列 30 種模型,它回覆了一個 SWOT 分析,但我看了下書籍的目錄,我發現並沒有提到這個模型,於是我就問它哪裡提到了這個內容,然後它的回答是「我混淆了這本書和其他一些管理類書籍中的內容」:
這個可以說是非常非常大的錯誤,如果內容無法保證準確,那後續的效率和改變都是空談。
我研究和測試了下,造成這個問題的原因還是 ChatGPT 的字數限制,我們沒法將書裡的所有字都給 ChatGPT,我們需要做一些相對 Hack 的事情,最終導致這個結果有點問題。而且我在測試的時候,ChatPDF 還在用 ChatGPT-3 模型,還不支援圖片,ChatPDF 應該是先用 OCR 技術,將PDF 轉為文字,再將內容傳給 ChatGPT,所以也有部分原因是 PDF 轉文字時,導致了內容缺失和錯誤。
再說下對話式學習的問題,目前嘗試下來有好有壞:
- 對於目標明確的內容來說,這種閱讀方式非常高效(前提是內容準確),你可以有針對性地問 AI 論文或書籍裡的內容,而且它比影片 Summary 要好,對於一些感興趣的問題,你可以有針對性地詢問。而不僅僅只是總結。
- 對於目標不太明確的內容來說,這種方式就很低效,你會迷茫,不知道應該問它啥,《長壽》這本書有 400 多頁,但我只能問出它講了什麼,有什麼方法能延長壽命。其他的問題,只能透過 AI 的回答,再進行探索。這個效率可能還不如一頁一頁地讀,起碼我讀到不感興趣的地方可以跳過,感興趣的地方停留,保證效率的同時,還能儘可能地獲得知識。但對話式的主動探索就不太行。
對於目前這種對話式的 AI 閱讀輔助工具,我更傾向於用於閱讀比較明確的場景,比如:
- Q&A 文件,或者說客服類內容。
- 教程類文件,比如某個前端框架的說明文件,如果你只是想了解裡面的某些細節,使用這種閱讀方式效率就很高。
- 主題精準垂直的論文或報告。這個可能對於學生、研究人員來說會比較有用。
對於其他型別的書籍,我覺得還有很大很大的最佳化空間,而且這跟模型的技術限制無關,即使 OpenAI 放開了字數限制,不解決對話式互動問題,適用的範圍還是比較窄。
關於這個問題,我倒是有個不成熟的想法,AI 能總結,應該也能重新組合,如果我們能設定一定的框架指令碼,是不是能將書的內容,做成互動式的遊戲?
或者類似我在 Summary 一文中提到的那樣,給一些示例給 AI,然後 AI 能返回一些你可能 Highlight 的內容,亦或者將書籍內容做一些模版性的總結?
1.2 ChatPDF與 ChatDoc 對比
首先說說 ChatPDF 和 ChatDoc 。我這次,用它倆嘗試閱讀了下《The Great Mental Models》(這本書其實就是《思考的框架》的英文版)。從結果來看,ChatDoc 的確要比 ChatPDF 靠譜很多。這個是 ChatPDF 的總結:
這個是 ChatDoc:
從內容的準確性來說,我覺得 ChatDoc 比 ChatPDF 要好很多。
首先,我覺得 ChatDoc 的左 PDF,右邊 AI 助手的設計,比 ChatPDF 的對話式設計要好非常多。當我遇到不懂的地方,我可以框選左側的內容, ChatDoc 會自動將內容帶到右側的輸入框,我只需要做一些補充提問即可,比如下圖裡,我問 AI 某章節主要講了什麼內容,在閱讀一些英文書籍或論文,這個模式對我的幫助也很大,我可以問 AI 這句話是什麼意思,甚至可以讓 AI 以更易於理解的話術解釋那句話。
另外,在上圖,你還能看到我針對書中的某個細節進行了提問,答得非常好。有兩個令我 Aha 的時刻:
- 第一次提問的時候,我打錯字,將「無法透過」,打成了「無法同構」,但 AI 的回答還是正確的。
- 第二是 AI 將這個答案相關的頁碼都標出來,並且幫我找到了我之前忽略的節點。這個問題,在書中的第一章,所以你能看到很多 20 頁左右的引用,但 AI 還找到了 92 頁 的內容,這個是我沒想到的。如果它能畫思維腦圖,那估計會更有用。
你在好好學習裡看到的總結,就是我用這個工具輔助完成的。
1.3Readwise
再來說說,Readwise 閱讀文章的感受,Readwise 的 AI 主要有以下幾個功能,你可以問問題,讓 AI 做總結。不過這個產品最大的問題是響應速度,讓它總結文章,要 loading 很久。
並且,對於 AI 輔助閱讀文章來說:
- 這種 Summary 意義不算很大,因為一般看標題就知道文章說啥了。
- AI 輔助效果取決於文章內容的解構,以及資訊顆粒度。我實驗了大概有幾十篇文章,主要涉及 newsletter 和與時間管理、生產力效率有關的文章,我發現類似 Morning Brew 這種主要以資訊羅列為主的 newsletter,AI 輔助意義不算特別大,效果也很不好,因為內容都很瑣碎,AI 不知道什麼是重點,只能什麼都總結一下,或者因為內容太多,導致超出字數,只總結了一部分。對於主題比較聚焦的文章,總結效果倒是好很多。
- 透過問問題的方式閱讀,其效率遠比掃描閱讀低。比如拿上面那張圖裡的文章為例,我想知道文章裡提到的創造運氣的方法有哪些,文章很短,我滑鼠只要滑幾下,就能定位到方法。但如果我用 AI,我還要打一串字,如果 API 或網路不穩定,答案返回的時間會長,總耗時反而更久。
1.4 小結
回顧開頭四個問題:
- AI 輔助提高了人的閱讀效率嗎?
- 它能幫助人更好地瞭解和記憶書中的內容嗎?
- AI 技術有可能改變人的閱讀方式嗎?
坦率說來,以目前用到的工具來看,AI 工具還有很多缺點,但整體來說,我認為它很可能會改變我的閱讀方式,並且在某些場景提升我的閱讀效率。
以下是我總結的 AI 優勢,以及我認為可能改變的點。
- 優點一:提升檢索速度
我的「閱讀」一般分成兩種,一種是「學習型」的閱讀,另一種是「檢索型」的閱讀。
前者需要的是「網」,後者需要的是「點」。比如學習前端庫 React,你需要看它的官方文件,甚至需要在自己的電腦上,跑一下官方 Demo,你需要建立完整的框架,並實踐,才能算學會使用。
但如果你只想查詢某個問題,那就只需要搜尋一下文件,找到某個點就可以了。而 AI 非常擅長這個。以前這類閱讀場景,我都是依賴搜尋完成,但檢索型的閱讀,很多時候很難確定搜尋詞,需要多次搜尋,才能找到答案,而現在依靠 AI,搜尋具備了文字理解能力,除了能幫你定位到位置外,還能直接給你答案。
對於檢索型閱讀,我認為 AI 能提高很多效率。
- 優點二:打破語言壁壘
- 優點三:基於點進行解釋
優點二和三,我覺得算是一類,這兩點會極大地改變我的閱讀方式。以前不管是學習型閱讀還是檢索型閱讀,都會遇到「看不懂」的問題。
第一種是語言上看不懂,這種就依賴翻譯軟體,但這些軟體翻譯的質量都比較一般。現在用上 ChatGPT 的翻譯,效果好很多,這將會極大地拓寬我的閱讀面。甚至我現在可能會考慮看日語、法語等非英語書籍。
第二種是字都看懂了,但看不懂表達的意思。有了 AI 輔助,很多複雜的內容,都能讓 AI 解釋一遍。甚至還能讓 AI 進行舉例(不過這個準確度要比檢索和翻譯低很多)。
- 優點四:找到人忽略的點
人的短期記憶容量,如果用 AI 產品常用的單位 token 來計算,遠遠小於 GPT-4 的 32,768 token(約為 23,000 個英文單詞),所以人類在進行「學習型」閱讀時,最常用的方法就是做筆記,將重點標註出來,減輕記憶負擔。
但不管如何記錄,人總有忽略的地方。比如我在前面提到的 ChatDoc 的例子,我讀到 90 多頁的時候,完全沒想起它講的內容跟第 20 多頁內容有關係,但 AI 幫我找到了。
- 優點五:挖掘網狀結構(暫時未看到哪個產品能做到)
這個跟優點四有點關係。
因為物理輸入方式限制,導致我們的閱讀很多時候都是線性的,但人的思想是網狀的,書本有的時候傳遞的也是網狀的資訊,所以才有了所謂的思維導圖等工具,幫助人更好地理解書本的資訊。
所以我就想到,既然 AI 已經能找到人忽略的點,那是否也能幫助我們建立網狀圖?
再發散地看,是不是筆記類的產品,也會被改變?像 RoamResearch 這類依賴使用者手動打 tag 的文件工具是不是也會被顛覆?人只需要記錄就好了,剩下的交給 AI。需要一個記錄健身資料 Database?你只需要先記錄健身資料,不需要考慮表如何設計,讓 AI 生成一個即可。並且記錄方式也會發生改變。以前是先有表,再有資料,現在只需要先有資料就行。
回到前面提到的問題:
- AI 輔助提高了人的閱讀效率嗎: 可以,特別是「檢索型」閱讀。
- 它能幫助人更好地瞭解和記憶書中的內容嗎: 可以,但要用對方法和工具。AI 不是替代閱讀,而是輔助閱讀。現在很多產品還是會說胡話,但我相信未來會變得更好。
- AI 技術有可能改變人的閱讀方式嗎:這個我持保留意見。現在 AI 工具仍然只是輔助,並沒有直接改變人的閱讀方式。對我來說,倒是拓寬了我的閱讀邊界(注意,我這裡說的閱讀方式,是像 ChatPDF 這種對話式閱讀方式的改變)。
2.進一步討論AI摘要總結會取代人工摘要總結嗎?
最近 AI 相關的話題非常火爆,也有部分朋友留言說 AI 出現,我們這種人工 Summary 遲早要被淘汰。也有人說有了 AI,總結起來會不會更快。
2.1 目前 AI Summary 工具是如何實現的?又有哪些限制?
聊對比前,我想先科普一些 ChatGPT 相關的知識,各位瞭解這些知識後,才能更好地對比 AI Summary 和人工 Summary。
-
Token:這個指的是 OpenAI 處理文字的基本單位,可以是單詞或者字元的片段。例如,“hamburger” 被分成 “ham”、“bur” 和 “ger” 三個 Token,而 “pear” 是一個 Token。1個 Token 大約相當於 4 個字元或者 0.75 個英文單詞。
-
一些限制:
- OpenAI 的模型有一個固定的 Token 限制,例如 GPT-3 的 Davinci 模型最多可以處理2049 個 Token,大約 1500 個英文單詞。最新 Turbo 模型大約是 4,096 個 Token,大約是 3000 個英文單詞。
- 另外這個限制還有一個細節,Token 限制的計數包含輸入和輸出的文字。換句話說,不是說我輸入 3000 個英文單詞,然後 OpenAI 能返回 3000 個英文單詞的結果,而是輸入+輸出總共不能超過 3000 個英文單詞。
- 文字限制。目前 OpenAI 的 GPT-3 模型只能處理文字。
懂了這幾個限制後,我再講解下,市面上的影片/Podcast Summary 是怎麼做的。實際上你能直接用 ChatGPT 模擬這些外掛。
首先,因為限制 #3 ,需要將影片/Podcast 的音訊轉為文字。這一步因為 Youtube 有 Transcript,所以很多產品會直接拿 Transcript 來用。
第二步將 Transcript 和 Prompt(一般是「請總結以下內容」)一起傳給 OpenAI 。傳給 Open AI 的東西類似這樣,你也可以在 ChatGPT 上試試,只需要將下方 Transcript 的內容替換成 Youtube 上的真實 Transcript 即可:
Please summarize the following sentences.
Text: """
Transcript
"""
最後 OpenAI 就會返回 Summary 結果。
但某些影片和 Podcast 會非常長,一集可能有幾萬字,因為 #2 的限制,根本沒法將一集完整的 Transcript 都傳給 OpenAI,所以不同的產品,會有不同的處理方式。目前常見的處理方式是「裁切總結」,將 Transcript 切成多個時長為 5 分鐘的 Transcript ,再傳給 OpenAI ,讓 OpenAI 先總結一遍,然後再將這些段落總結,傳給 OpenAI ,再讓它總結一遍,生成最終的總結內容。
2.2目前 AI Summary 的缺點
瞭解完這些 Summary 應用的原理後,目前這類產品的缺點也就相對好理解了:
- 缺點一:內容依賴 Transcript。
某些沒有 Transcript 的內容基本沒法 Summary。比如短影片,或者 vlog,很多都是隻有畫面,沒有說話內容。這些都沒法 Summary。
當然應該沒有人需要短影片 Summary 吧,內容已經夠快餐了 ?
- 缺點二:內容質量依賴 Transcript 質量。
如果 Transcript 質量不好,AI 總結出來的內容會非常奇怪,舉個例子,如果 Transcript 包含了背景音樂裡的歌詞,AI 就會總結這段歌詞。人看到就會很奇怪,突然中間來了一段「愛拼才會贏」的總結。
- 缺點三:Token 限制導致內容缺失。
人一分鐘大約能講 125 - 150 個英文單詞,180 - 200 箇中文。按照現在人們看影片的習慣,影片內容一般不會超過 15 分鐘,換算下來大約是 2200 個英文單詞左右,或者 3000 箇中文字,不過很多影片都不會一直說話,所以字數會少於這個數。
所以很多做影片 AI Summary 就會簡單處理 Token 限制的問題,比如只傳 2500 個英文單詞,然後讓 AI 返回 500 個英文單詞的內容。這種處理方式就比較粗暴(但並不是不能用,哈哈哈),對於長影片來說,就會缺失後半段的總結,如果後半段有反轉,那總結就會是完全錯誤的。
比如 Glarity 這個外掛,給 Knowledge Project 141 的總結是這樣的:
這段影片中,Kunal Shah談到了他從家族企業中學到的幾個成功做生意的要素。他們中的大多數人來自於商人的社群,這種社群的人更願意承擔風險、具有更低的羞恥感、更能理解事物的價值、更能發現新的趨勢、並且願意幫助自己的社群成功。這些特點讓這些人更有可能在商業上獲得成功。
對比看看我的總結,這段總結應該只輸入了前15分鐘的內容。(BTW,我這裡並不是說這樣設計不行,因為 Glarity 支援自定義 prompt,它是我目前常用的 AI 外掛之一,只是覺得它能更好 ? )
- 缺點四:層層總結導致內容缺失。
當然也不是所有人都那麼做,切分總結能部分解決缺失的問題,但切分時長就很關鍵,如果太長,比如 15 分鐘,3000 個英文單詞,AI 就沒法返回總結了。
另外,這種層層總結,也會導致資訊缺失。第一次總結,類似將照片切成一塊塊,然後逐個打碼,最後再將這些打碼後的塊,組合成一張圖,再打一次碼,內容少了,也更不清晰了。
- 缺點五:AI 並不知道什麼是重點。
如果前面 4 個缺點,在技術上未來應該能解決(比如 OpenAI 放開限制到 8K 個 Token),但最後的一個缺點,相對來說,我還沒想到如何解決,舉個實際的例子。
還是以 Knowledge Project 141 為例,Summarize.tech 的 Summary 方式是將影片切分成 5 分鐘的一段,然後再對生成的內容進行二次總結。我們一起看看這個結果:
00:15:00 The author discusses how he has learned that many concepts in western society are not applicable to Asian societies, such as the value of time. He also discusses how Hinduism is not as scalable as other religions because it is not standardized.
裡面提到一個 “such as the value of time”,我在聽這一段的時候,我認為這段內容很精彩。因為這段 Kunal 聊的是「為何很多工具產品在亞洲賺不到錢」,他解釋原因是對於許多亞洲國家來說都是如此,時間作為一個價值概念從未被教導過。
但如果你看上面的 AI 總結,其實省略了很多內容,並且吸引力不夠,如果我讀得快一點,很可能就會忽略它。再看看另一個例子:
00:35:00 In India, less than six percent of urbanIndian women have financial income of their own, and 94 of them are currently taking care of kids or taking care of the family and not contributing to the labor force. Another interesting thing is 95 of all financial products in India are bought by men. Credit cards, car loans, and home loans are all by men, while investments are only by men. India has now nearly two thousand dollars per capita income yearly, but if you remove the top 30 million families or 30 million individuals, the per capita income would drop to maybe 600. This is why many western markets love to come to India, because its per capita income is never going to beat and grow like China's because before China started becoming affluent, 96 of Chinese urban women were working because of the one child policy which forced it to become a general neutral society. However, in India, female participation of labor is going down. The per capita income is not going to grow and therefore a lot of foreign companies love to come to India because India is the "dau farm of the world." All the big internet giants, like Facebook, Twitter, and YouTube, will say "I have 500 million billion users in India, but look at the arpu and peel the ar
首先這個總結應該是 Token 到達上限,最後沒有輸出完。讓後拿這個總結和上一個總結做對比,你應該會和我一樣有相同的疑惑,為何這段總結更長?更詳細?
我自己也嘗試寫了一些 prompt,這一塊即使 ChatGPT 也做不到很好的一致性(換句話說,你反覆提問一樣的問題,它會給你返回不同的答案),暫時不知道它以什麼標準進行總結。
但我也測試出來了一些有意思的東西,最後會跟大家分享。
2.3 AI Summary 會取代人工 Summary 嗎?
我的想法是:
- 值得總結的,它暫時還做不好。
- 它能做好的,總結的意義感覺也不是很大。
我目前嘗試下來,AI 最擅長總結的是那些科技產品評測,特別是像鍾文澤做的那些開箱評測,總結準確還很全。但我想說這些評測你會只看文字版本嗎?
我不太會。
所以我也很好奇,這些 AI Summary 工具的次留是怎樣的。
我反而覺得可能將這些結果重新組裝,做成新產品,可能還有意思一些。
比如將全網評測 iPhone 14 的影片都總結一遍,然後將這些總結結果再做一些統計,那我就能知道各種 UP 主是怎麼評價 iPhone 14 的,讚的人有哪些,讚的地方有哪些,踩的人又有哪些,又踩了什麼。
現在的 AI 產品玩法,都還是脫離不了文字的互動方式,以及直接跟 AI 互動的方式。為何不試試用 AI 的結果做產品?以前要想搞一個什麼值得買很難,需要很多人力,現在會不會簡單一些呢?
再說說它暫時做不好的內容,我可能會用它來做輔助,但用它做輔助也有兩個擔憂:
- 我不知道它總結的全不全。
- 被動學習變成主動學習:這個跟第一條有點關係,純聽,或者看文字稿,我大部分時間是被動學習,我能很快判斷這個是不是值得記錄的,但現在它總結給我,我就要主動去想它總結的內容是什麼,是不是值得細聽。
所以就我目前測試下來,文字稿對我的輔助作用最大。其次才是 AI 總結,它幫到我的更多的是定位重點,作為
不過我相信未來應該會有更好的解決方案,比如未來應該會支援更多媒介,並且 Token 的限制也會放寬。
2.4 相關摘要prompt最佳化技巧
我在前面提到 AI Summary 不知道什麼是重點。但如果你傳給 AI 的 Prompt 裡包含一些案例,它就能根據你給的案例做一些最佳化。某種程度上是告知它什麼是重點。
簡單說,類似這樣的:
In India, less than six percent of urbanIndian women have financial income of their own, and 94 of them are currently taking care of kids or taking care of the family and not contributing to the labor force. Another interesting thing is 95 of all financial products in India are bought by men. Credit cards, car loans, and home loans are all by men, while investments are only by men. India has now nearly two thousand dollars per capita income yearly, but if you remove the top 30 million families or 30 million individuals, the per capita income would drop to maybe 600.
Highlight: less than six percent of urbanIndian women have financial income of their own.
然後下一段話,你就可以這樣問,ChatGPT 會返回它理解的 Highlight 內容給你:
This is why many western markets love to come to India, because its per capita income is never going to beat and grow like China's because before China started becoming affluent, 96 of Chinese urban women were working because of the one child policy which forced it to become a general neutral society. However, in India, female participation of labor is going down. The per capita income is not going to grow and therefore a lot of foreign companies love to come to India because India is the "dau farm of the world."
Highlight:
未來基於 AI 做一個專屬於個人的推薦或者 Summary 系統是有可能的。只是你需要給不少初始化資料給模型。
比如人對某篇文章的開頭段落進行高亮,後續 AI 就能自動根據你的高亮結果,高亮文章後續可能被高亮的內容。當收集的資料足夠多,新的文章都能自動高亮了。
3.更多AI產品推薦演示
3.1 ChatMind.Tech
自動生成流程圖
3.2 Effidit
智慧創作助手 Effidit(Efficient and Intelligent Editing) 是由騰訊 AI Lab 開發的一個研究性原型系統,探索用 AI 技術提升寫作者的寫作效率和創作體驗(線上體驗推薦使用 Chrome 或 Microsoft Edge 瀏覽器)
4.總結
-
ChatGPT可以幫助我們更快速、更準確地獲取資訊。在日常生活中,我們經常需要查詢各種資訊,例如新聞、天氣、交通等,而ChatGPT可以透過自然語言的方式,快速地回答我們的問題,節省了我們查詢資訊的時間和精力。
-
ChatGPT可以幫助我們更好地進行學習和閱讀。在學習和閱讀過程中,我們經常會遇到各種問題和難點,而ChatGPT可以透過智慧問答的方式,幫助我們解決這些問題和難點,提高我們的學習效率和閱讀理解能力。
-
ChatGPT還可以幫助我們更好地進行工作。在工作中,我們經常需要處理各種複雜的問題和任務,而ChatGPT可以透過智慧問答、自動化處理等方式,幫助我們更好地完成這些任務,提高我們的工作效率和質量。