語言大模型

兔兔求放过鸭發表於2024-08-07

大語言模型:

大所指代的包括三點

  1. 引數量大,處理自然語言的問題十分繁瑣,大量的引數可以滿足模型所需要的複雜性。
  2. 資料量大,大語言模型的訓練需要大量的資料來保證其輸出內容的準確性,泛化性。
  3. 複雜性大,處理語言問題需要較強的複雜性。

模型的作用是處理,分析和生成資料。

  1. 模型透過呼叫處理資料相關函式將匯入模型的資料處理為數字資料
  2. 模型透過呼叫分析資料相關函式

計算機要想處理相關資料,必須將資料加工為計算機能夠讀懂的資料,此處一般指各種數字類資料,而我們要將研究的問題轉變為數字相關的問題。

大:

模型的大,能夠滿足模型解決複雜問題的需求。

我們知道,當你為別人解答問題時,如果是一個學科類問題,比如一道數學題,物理題,化學題,他可能存在標準答案,但是我們往往要面臨的確實語文題,他沒有標準答案,又或者它有一個隨著提問環境隨之改變的標準答案,在解決這類問題時,需要經過複雜的思考,因此,為了讓我們的模型具備複雜思考的能力,我們需要有較大量的複雜處理,大量的引數可以從結果的獲取來說,它可以演示我們對同一個問題因種種因素而產生的不同的思考。

其次,我們知道,隨著年齡的增長,隨著我們閱歷的豐富,我們解決實際複雜問題的能力也會提高,大模型雖然無法去親身經歷這些事件,但是透過我們相關資料的匯入,讓大模型從中學習,來提高解決相應問題的能力,隨著匯入匯入資料量的增加,大模型的泛用性會提高()

比如當你生氣的時候,在某些情況下,你透過自我調節就可以很好的恢復狀態,但是在某些情況下,你需要合理發洩自己的怒火,除此之外,還有許多做法。決定選擇以上哪種做法的因素,比如生氣的原因,場合,生氣的物件……

模型:

如何讓計算機能夠聽懂人類的語言?難度在哪裡?

從人類角度談起:

假設你的對面有一個人,當他流利地說出一句話時,如:我喜歡你媽做的蛋糕。你能比較輕鬆的理解。

現在你的對面是一個結巴,當他吞吞吐吐地說出:我,喜,歡,你,媽,做,的,蛋,糕。時,你發現,只有當句子比較完整時,你才能準確知道它所表達的意思。

因此,模型在獲取對話內容的時候,也是一句話一句話匯入的,而不是一個字一個字匯入。

從模型角度講:

模型並不認識文字,也不知道文字與文字直接的聯絡,以及人們如何透過文字傳遞資訊,模型又該如何透過文字將資訊傳遞出去。因為計算機對於數字的應用要高於文字的應用,因此,我們通常採取將文字資訊轉化為數字資訊,將兩個人的溝通轉化為數字問題。

相關文章