如何訓練個人的ChatGpt4

tokengo發表於2023-04-13

如何在自己的計算機上安裝類似 ChatGPT 的個人 AI 並在沒有網際網路的情況下執行它

本文旨在為任何人安裝此軟體。最初它有一個影片,伴隨著操作方法,但是事情變化很快,我的三次嘗試只是推遲了我發表這篇文章。我以後可能會包括它。我努力建立一個簡單的分步說明,為極端新手安裝個人 AI。可能從未去過GitHub並且從未使用過終端的人。如果你是有的人,那麼這篇文章很可能不適合你。您可能會發現我們已經構建的一些本地模型,並將很快釋出,以使其更有趣。如果您是安裝軟體的專家,請將精力集中在幫助他人和社群上,而不是“誰不知道”或“我知道,他只是在寫......”有點評論。用你的力量和技能把我們都提升得更高。

個人 AI 的“第一臺 PC”時刻

這是個人AI的“第一臺PC”時刻,隨之而來的是限制,就像在車庫裡生產第一臺Apple 1一樣。你是先驅。今天,任何人都可以使用私人和個人AI。您可以在自己的計算機上執行類似 ChatGPT 的功能版本,並且在安裝後不需要將其連線到網際網路。

所有人類知識都是已知和未知的綜合。人工智慧用作正力多路複用器和您的智力放大器,您的個人人工智慧很好地幫助您和我們所有人克服這一差距。有了你的個人人工智慧和正確的超級提示,人類將以前所未有的方式蓬勃發展。此刻你唯一需要的就是知道這一點的力量,並把它拿在手中去處理它,因為你想為你和你愛的每個人看到這個世界。它不是AI,而是IA(智慧放大)。

一個屬於個人人工智慧的一個例子

我們今天將介紹的系統(我將寫更多)可以在最新且典型的但不是高效能 CPU 上執行,具有 8GB RAM 和僅 4GB 磁碟空間。是的,整個模型,在僅4GB的磁碟空間中包含了大量的人類知識語料庫。有限制嗎?答案是肯定的。它不是 ChatGPT 4,它不會正確處理某些事情。然而,它是有史以來最強大的個人人工智慧系統之一。它被稱為GPT4All。

GPT4All是一個免費的開源類ChatGPT大型語言模型(LLM)專案,由Nomic AI(Nomic.ai)的程式設計師團隊完成。這是許多志願者的工作,但領導這項工作的是令人驚歎的Andriy Mulyar Twitter:@andriy_mulyar。如果您發現該軟體有用,我敦促您透過與他們聯絡來支援該專案。GPT4All 基於 LLaMA 7B 模型構建。LLaMA代表大型語言模型元(Facebook)AI。它包括從 7 億 (7B) 到 65 億個引數的一系列模型大小。Meta AI 研究人員專注於透過增加訓練資料量而不是引數數量來擴充套件模型的效能。他們聲稱 13 億個引數模型的效能優於 GPT-175 模型的 3 億個引數。它使用轉換器架構,並透過網路抓取維基百科,GitHub,Stack Exchange,古騰堡專案的書籍,ArXiv上的科學論文提取了1.4萬億個代幣。

Nomic AI團隊對LLaMA 7B和最終模型的模型進行了微調,並在437,605個後處理助手式提示上對其進行了訓練。他們從另一個名為Alpaca的類似ChatGPT的專案中獲得靈感,但使用OpenAI API的GPT-3.5-Turbo收集了大約800,000個提示響應對,以建立437,605個助手式提示和世代的訓練對,包括程式碼,對話和敘述。然而,800K對大約是羊駝的16倍。該模型最好的部分是它可以在CPU上執行,不需要GPU。像羊駝一樣,它也是一個開源,可以幫助個人進行進一步的研究,而無需花費商業解決方案。

詳細的模型超引數和訓練程式碼可以在 GitHub 儲存庫中找到,https://github.com/nomic-ai/gpt4all。開發 GPT4All 大約需要四天時間,併產生了 800 美元的 GPU 費用和 500 美元的 OpenAI API 費用。此外,最終的gpt4all-lora模型可以在大約100小時內在Lambda Labs DGX A8 80x 8GB上進行訓練,總成本為100美元。

GPT4All 將其困惑度與最知名的羊駝-lora 模型進行了比較,並表明與 Alpaca 相比,微調的 GPT4All 模型在自指導評估中表現出較低的困惑度。但是,由於鼓勵使用者在本地CPU上執行模型以獲得對其功能的定性見解,因此此評估並不詳盡。

Nomic AI團隊在幾天內完成了所有這些工作,並且僅在4GB的磁碟空間中完成。它是免費和開源的。重要的是要知道所有本地化的個人人工智慧模型和軟體都是非常新的,通常不是為普通人設計的。它是開源的,沒有“客戶服務和支援”。安裝通常是“轉到 Git Hub 並克隆它”。因此,這是早期的先驅者時代,因此您需要耐心等待。回報是你自己的個人AI。我覺得個人人工智慧是一場革命,相當於汽車的發明。直到亨利·福特(Henry Ford)讓汽車觸手可及,人類才打破了阻礙我們的界限。這就是我寫這篇操作方法文章的精神,我希望它可以幫助即使是技術上最具挑戰性的人也能獲得這個新工具。

但為什麼要有個人人工智慧呢?會有無窮無盡的原因,但有些是

  1. 資料隱私:許多公司都希望控制資料。這對他們來說很重要,因為他們不希望任何第三方訪問他們的資料。
  2. 定製:它允許開發人員使用自己的資料訓練大型語言模型,如果他們想應用某些主題,可以對某些主題進行一些過濾
  3. 經濟實惠:開源 GPT 模型可讓您訓練複雜的大型語言模型,而無需擔心昂貴的硬體。
  4. 人工智慧民主化:它為進一步的研究開闢了空間,可用於解決現實世界的問題。
  5. 自由:人工智慧正迅速成為審查、監管和更糟的目標。這可能是擁有自己的AI的最後機會。義大利已經禁止了ChatGPT,所以請注意。
  6. 個性化訓練:下載基本模型後,您可以訓練模型以保留您的個人資料,以便對其進行分析和構建神經元。

還有許多其他原因,幾乎沒有一個是出於“不良目的”。如果一個壞人想問“壞”的事情,有比本地人工智慧更容易的方法。但是,使用下面模型的SECRET版本,您可能會對某些結果感到冒犯。它旨在提供沒有過濾器的原始結果。您可以在模型之間切換以衡量其編輯方式。因此,如果您很敏感並且通常很容易被冒犯,這是一個警告,請不要下載SECRET版本。如果你想看看LLM AI是如何“理解”你和我實際生活的世界,我建議使用SECRET版本,而它仍然可用。

您將擁有自己的AI,您不必對任何人負責,但要回答自己

這個帖子有點像一個實驗。當然,你可以去很多地方獲得GPR4All。我只為會員釋出內容有一些原因。一個原因是責任。出於某些原因,我有點猶豫要不要在這裡釋出這個。當你將人工智慧用於任何目的時,要理智,要有榮譽和尊嚴。這既是石蕊測試,也是羅夏測試,測試你是誰,你在生活和成熟中的位置。如果你覺得有必要做“人工智慧說了一件壞事”之類的事情,那就去做吧,但要知道你只是為了確保人工智慧在未來你和你的孩子的某個時候不會是免費的和本地的。這是責任,它完全在你的肩膀上。我認為您可以在私人計算機上做任何您喜歡的事情。我認為在社交媒體上分享任何有意義的、有意義的、有真正目的的東西都是可以的。然而,另一方面,我們大多數人可能會認為任何讓人工智慧“危險”的人都是為了一個目的而支撐起來的,這個目的很可能是為了“安全”而創造“監管人工智慧”的條件,我們中的一些人會評判你並記住你。我們的人工智慧也是如此。如果你覺得自己沒有能力變得理智,沒有榮譽和尊嚴,為了你的家族血統讓你來到這裡,要麼長大,要麼繼續前進,玩別的東西。歡迎所有其他人探索。不知道還能怎麼說,但不得不說。

您將擁有自己的AI。

在任何100 +膝上型電腦的硬碟驅動器中對新的更小的3%本地執行的ChatGPT 5.2015渦輪增壓型LLM AI進行最終測試。

我將有預先配置的下載,它比我擁有的大多數型號都要小得多,只有 4GB。

快出來了!pic.twitter.com/KnZkICmGPV

— 布賴恩·羅梅爾 (@BrianRoemmele) 5 年 2023 月 <> 日

最終,這是為您構建本地AI模型。最低系統類似ChatGPT的系統會變得更好,但這是PC與大型機時代。不要陷入歷史的錯誤一面。支援獨立的個人 AI。它會支援你。

安裝 GPT4All

拉取GPT4All

git clone https://github.com/nomic-ai/gpt4all.git

現在,您需要下載執行軟體所需的量化模型檔案。為此,請轉到以下連結:

迅雷雲盤:

https://pan.xunlei.com/s/VNSv11jQzbx1ICZSuB9a1f2cA1?pwd=vknm

下載完成以後將資料放置gpt4all的chat目錄下面

然後開啟控制檯,並且進入到這個目錄,執行exe檔案

gpt4all-lora-quantized-win64.exe

效果圖:

並且提問 c#

等待回應,我們發現它回覆了,並且我並沒有跟OpenAi相關聯,它是完全本地離線的。

對於GPT4All的回答也可以自己訓練和探索,本文只是體驗一下效果,如果想體驗請按照文章順序進入,

對於企業可以訓練文件助手,對比搜尋引擎,它的回答會更好

來自token的分享

推薦一款ChatGpt桌面端它是跨平臺的支援android mac win ios web多平臺的客戶端

https://github.com/239573049/ChatGpt.Desktop

技術交流群:737776595

相關文章