AI 大模型應用開發實戰(04)-AI生態產業拆解

公众号-JavaEdge發表於2024-06-23

1 行業全景圖

2 結構拆解AI GC

生成式AI這個產業。分成上中下游三大塊。

2.1 上游基礎層

主要包括:

  • 算力:包括AI晶片和雲服務等,例如像英偉達、AMD以及華為等廠商提供的算力基礎設施。大型模型基於Transformer架構,對算力的需求很大。
  • 資料:新時代的石油,分為基礎資料服務、資料集和向量資料庫。
  • 演算法:演算法基礎包括TensorFlow、PyTorch等著名演算法框架,以及百度、阿里、騰訊等公司提供的AI開發平臺。

這是AI的基礎,也是過去AI研究的重點。

2.2 中游-AIGC大模型層和工具層

大模型層分為:

  • 通用模型:如OpenAI、騰訊的宏源、百度的1000萬等,
  • 行業模型,根據具體行業或業務進行微調或二次訓練。工具層包括AI Agent,其中包括像OutGPT這樣的工具,以及模型平臺和模型服務等

2.3 下游應用層

包括:

  • 內容消費:在各種平臺上生成內容,如抖音、快手等
  • 創作工具:提供基於AI的工具,如MID Generate
  • 企業服務:根據行業提供各種應用,如微軟、亞馬遜等

產業中,我們的位置是在AI GC工具層,即AI Agent層,作為中介軟體,承上啟下。應用開發者的位置可能更多在中游和下游,發揮著重要作用。

3 名詞解釋

當然,可以按以下類別對這些概念進行細分解釋:

3.1 模型與架構

  1. LLM (大型語言模型):具有大量引數,能處理複雜語言任務的模型。
  2. chatGPT:一種用於生成對話的自然語言處理模型。
  3. RWKV:結合RNN和Transformer優點的神經網路架構。
  4. CNN (卷積神經網路):一種擅長處理影像資料的神經網路。
  5. RNN (迴圈神經網路):處理序列資料的神經網路。
  6. stable diffusion:一種用於生成影像的擴散模型。
  7. DALL·E:OpenAI開發的生成影像的模型。
  8. RAG (檢索增強生成):結合檢索和生成的模型。
  9. AIGC (人工智慧生成內容):指利用AI生成文字、影像等內容的技術。

3.2 技術與方法

  1. 多模態:處理多種不同型別資料的模型。支援多種形態的模型,如文字、影像、音訊等

  2. 自監督學習:利用資料本身結構進行訓練的方法。

  3. 預訓練:在大規模資料上訓練模型,以獲得初始引數。

  4. Few-shot:使用少量樣本進行訓練和推理的能力。

  5. One-shot:使用單個樣本進行訓練和推理的能力。

  6. Zero-shot:無需樣本也能進行推理的能力。

  7. Temperature:控制生成模型輸出多樣性的引數。

  8. RLHF (基於人類反饋的強化學習):透過人類反饋最佳化AI行為的方法。

  9. Fine-tunes:在預訓練模型基礎上,進行特定任務的微調。

  10. 向量搜尋:透過向量化表示進行高效搜尋的方法。

  11. 向量資料庫:儲存和檢索向量化資料的資料庫。

  12. NLP (自然語言處理):處理和生成自然語言的技術。

  13. CV (計算機視覺):理解和生成影像和影片的技術。

  14. 分析式AI:側重於分析和理解資料的AI。

  15. 知識圖譜:以圖結構表示知識及其關係的資料結構。

  16. 過擬合:模型過度擬合訓練資料而無法泛化到新資料的現象。

  17. AI推理:AI對資料進行推斷和決策的過程。

  18. 生成對抗網路:透過兩個網路的對抗來提高生成結果質量的方法。一種神經網路型別,用於生成真實的影像。(Generative Adversarial Networks, GANs)是一種由 Ian Goodfellow 等人在 2014 年提出的深度學習模型。GANs 透過兩個網路(生成器和判別器)相互對抗的方式來提高生成結果的質量。這兩個網路的具體角色和對抗機制如下:

    1. 生成器(Generator):生成器接受一個隨機噪聲向量作為輸入,並生成偽造的資料(例如影像)。它的目標是生成儘可能真實的資料,以便欺騙判別器。

    2. 判別器(Discriminator):判別器接受真實資料和生成器生成的偽造資料,並試圖區分兩者。判別器的目標是儘可能準確地識別出哪些資料是真實的,哪些是偽造的。

    在訓練過程中,生成器和判別器會交替最佳化自己的引數:

    • 生成器的目標是生成越來越真實的偽造資料,以使判別器難以區分真假資料。
    • 判別器的目標是提高其區分能力,準確判斷資料的真假。

    這種對抗機制形成了一個零和遊戲,最終生成器會生成出非常逼真的資料,使得判別器難以辨別其真假。

    綜上,生成對抗網路是一種透過兩個網路的對抗來提高生成結果質量的方法,也是一種用於生成真實影像的神經網路型別。

  19. 元學習:學習如何學習的方法,提高模型在新任務上的適應能力。

  20. 並行訓練:同時訓練多個模型或在多臺裝置上訓練單個模型的方法。

3.3 平臺與工具

  1. HuggingFace:提供自然語言處理模型和工具的公司。
  2. openAI:開發和研究人工智慧的機構。
  3. Azure:微軟的雲端計算服務平臺。
  4. Heygan:一種AI生成模型(可能是特定應用的名稱)。
  5. Copilot:程式設計助手工具,幫助開發者編寫程式碼。
  6. midjourney:AI驅動的藝術創作平臺。
  7. D-ID:用於生成和處理數字身份的技術。

3.4 概念與其他

  1. 具身智慧:具有物理存在並能與環境互動的人工智慧。
  2. AGI (人工通用智慧):具有通用認知能力的AI。
  3. AI-Agents:自主行動並完成任務的人工智慧代理。使用AI代替人類執行任務的智慧體
  4. RPM:每分鐘旋轉數(Rotations Per Minute),這裡可能表示模型的訓練速度。
  5. 知知識幻覺:模型生成的看似合理但錯誤的知識。
  6. 咒語:特定輸入詞彙或短語,用來觸發模型生成特定輸出。
  7. 哼唱:AI生成的音樂或音訊。
  8. CDN (內容分發網路):用於加速網路內容傳輸。
  9. 上下文:模型生成內容時參考的前後文資訊。
  10. 煉丹:指模型訓練和調優過程的比喻。
  11. 煉爐:可能是某種訓練或計算環境的比喻。

關注我,緊跟本系列專欄文章,咱們下篇再續!

作者簡介:魔都技術專家,多家大廠後端一線研發經驗,在分散式系統設計、資料平臺架構和AI應用開發等領域都有豐富實踐經驗。

各大技術社群頭部專家博主。具有豐富的引領團隊經驗,深厚業務架構和解決方案的積累。

負責:

  • 中央/分銷預訂系統效能最佳化
  • 活動&優惠券等營銷中臺建設
  • 交易平臺及資料中臺等架構和開發設計
  • 車聯網核心平臺-物聯網連線平臺、大資料平臺架構設計及最佳化
  • LLM應用開發

目前主攻降低軟體複雜性設計、構建高可用系統方向。

參考:

  • 程式設計嚴選網

本文由部落格一文多發平臺 OpenWrite 釋出!

相關文章