AI大模型企業應用實戰(24)-什麼是zero-shot, one-shot和few-shot Learning？

公众号-JavaEdge發表於2024-06-25

1 Zero-shot learning

零樣本學習。

1.1 任務定義

利用訓練集資料訓練模型，使得模型能夠對測試集的物件進行分類，但是訓練集類別和測試集類別之間沒有交集；期間需要藉助類別的描述，來建立訓練集和測試集之間的聯絡，從而使得模型有效。

Zero-shot learning 就是希望我們的模型能夠對其從沒見過的類別進行分類，讓機器具有推理能力，實現真正的智慧。其中零次（Zero-shot）是指對於要分類的類別物件，一次也不學習。

1.2 例項

假設我們的模型已經能夠識別馬、老虎和熊貓了，現在需要該模型也識別斑馬，那麼我們需要告訴模型，怎樣的物件才是斑馬，但是並不能直接讓模型看見斑馬。所以模型需要知道的資訊是馬的樣本、老虎的樣本、熊貓的樣本和樣本的標籤，以及關於前三種動物和斑馬的描述。

通俗點說就是：假設小暗（純粹因為不想用小明）和爸爸，到了動物園，看到了馬，然後爸爸告訴他，這就是馬；之後，又看到了老虎，告訴他：“看，這種身上有條紋的動物就是老虎。”；最後，又帶他去看了熊貓，對他說：“你看這熊貓是黑白色的。”然後，爸爸給小暗安排了一個任務，讓他在動物園裡找一種他從沒見過的動物，叫斑馬，並告訴了小暗有關於斑馬的資訊：“斑馬有著馬的輪廓，身上有像老虎一樣的條紋，而且它像熊貓一樣是黑白色的。”最後，小暗根據爸爸的提示，在動物園裡找到了斑馬（意料之中的結局。。。）。

上述例子中包含了一個人類的推理過程，就是利用過去的知識（馬、老虎、熊貓和斑馬的描述），在腦海中推理出新物件的具體形態，從而能對新物件進行辨認。Zero-shot learning就是希望能夠模仿人類的這個推理過程，使得計算機具有識別新事物的能力。

2 One-shot learning

單樣本學習

Zero-shot learning 指的是我們之前沒有這個類別的訓練樣本。但是我們可以學習到一個對映X->Y。如果這個對映足夠好的話，我們就可以處理沒有看到的類了。

One-shot learning 指的是我們在訓練樣本很少，甚至只有一個的情況下，依舊能做預測。這是如何做到呢？可以在一個大資料集上學到general knowledge（具體的說，也可以是X->Y的對映），然後再到小資料上有技巧的update。

2.1 One-Shot Learning的意義

① 減少訓練資料

深度學習需要大量的資料。如MNIST為了10個類別的區分，需要60000張訓練影像，平均一個類別需要6000張訓練影像。

One-Shot試圖將一個類別的訓練影像減少，極端情況時只有一張圖片。

② 在新類別的資料出現時，無需重新訓練

傳統的神經網路無法處理沒有出現在訓練集中的類別。

如以員工刷臉打卡為例，使用深度神經網路，每一個新員工入職，都是一個類別，需要重新訓練深度神經網路。如果每天都有新員工入職，每天都要重新訓練網路，成本非常高。

One-Shot Learning可以無需重新訓練即可應用於新的類別的資料。

One-shot learning 屬於Few-shot learning的一種特殊情況。

3 Few-shot learning

小樣本學習

如果訓練集中，不同類別的樣本只有少量，則稱為Few-shot learning.

就是給模型待預測類別的少量樣本，然後讓模型透過檢視該類別的其他樣本來預測該類別。比如：給小孩子看一張熊貓的照片，那麼小孩子到動物園看見熊貓的照片之後，就可以識別出那是熊貓。

Few-shot Learning V.S Zero-shot Learning

小樣本學習的目的是在有少量訓練資料的情況下能獲得準確分類測試樣本的模型
零樣本學習的目的是預測訓練資料集中沒有出現過的類

零樣本學習和小樣本學習有很多共同的應用，如：

影像分類 (image classification)
語義分割 (semantic segmentation)
影像生成 (image generation)
目標檢測 (object detection)
自然語言處理 (natural language processing)

另外單樣本學習 (one-shot learning) 經常會和零樣本學習混在一起。單樣本學習是小樣本學習問題的一個特例，它的目的是從一個訓練樣本或圖片中學習到有關物體類別的資訊。單樣本學習的一個例子是，智慧手機中使用的人臉識別技術。

關注我，緊跟本系列專欄文章，咱們下篇再續！

作者簡介：魔都架構師，多家大廠後端一線研發經驗，在分散式系統設計、資料平臺架構和AI應用開發等領域都有豐富實踐經驗。

各大技術社群頭部專家博主。具有豐富的引領團隊經驗，深厚業務架構和解決方案的積累。

負責：

中央/分銷預訂系統效能最佳化

活動&券等營銷中臺建設

交易平臺及資料中臺等架構和開發設計

車聯網核心平臺-物聯網連線平臺、大資料平臺架構設計及最佳化

LLM應用開發

目前主攻降低軟體複雜性設計、構建高可用系統方向。

參考：

程式設計嚴選網

本文由部落格一文多發平臺 OpenWrite 釋出！

AI 大模型企業應用實戰(10)-LLMs和Chat Models
2024-06-23
AI大模型
AI 大模型企業應用實戰(06)-初識LangChain
2024-06-23
大模型LangChain
AI 大模型企業應用實戰(07)-LangChain的Hello World專案
2024-06-23
大模型LangChain
AI大模型企業應用實戰(25)-為Langchain Agent新增記憶功能
2024-06-26
大模型LangChain
AI三重問：什麼是AI？什麼是AI模型？什麼是AI大模型？
2023-11-01
AI大模型
AI 大模型應用開發實戰(04)-AI生態產業拆解
2024-06-23
AI大模型產業
企業大模型落地關鍵是什麼？這家領先的大模型技術和應用公司給出答案
2024-12-16
大模型
What Are Zero-Shot Prompting and Few-Shot Prompting
2024-07-22
2020-09-24: 什麼是應用解耦?
2020-09-25
解耦
什麼是大模型？
2024-05-22
大模型
從騰訊大模型的「實用」路線，我們看到了企業應用AI的新方向
2024-09-09
大模型AI
OpenAI Assistants API 企業級應用實戰
2024-11-18
OpenAIAPI
企業為什麼要做應用多活？
2022-02-14
歐盟的中小企業面臨的六大挑戰是什麼？
2024-08-15
Zero-shot Learning零樣本學習論文閱讀（三）——Semantic Autoencoder for Zero-Shot Learning
2020-12-27
為什麼要學習大模型應用開發？
2024-04-04
大模型
攻防實戰是什麼？
2022-07-01
什麼是大語言模型（LLM）？
2024-03-07
模型
企業上雲是什麼意思？企業上雲的好處是什麼？
2021-07-29
RFM是什麼？這個模型有什麼用？
2022-12-21
模型
SIEM是什麼？企業安全
2024-07-26
璞華AI大模型應用的探索之路：從AI大模型開發與運營平臺到應用寶庫的最佳實踐
2024-11-01
AI大模型
ollama搭建本地ai大模型並應用呼叫
2024-08-19
AI大模型
AI大模型在醫院門診應用
2024-08-07
AI大模型
企業IT可以真正應用AI的地方
2020-06-23
AI
特徵模型和特徵-這是什麼？
2022-01-05
特徵模型
企業擴大容器和Kubernetes應用的5大問題
2020-11-05
什麼是 SCRM，企業為什麼需要SCRM？
2022-04-21
什麼是 Web 應用效能評測領域的 RAIL 模型
2021-10-17
WebAI模型
大模型中的token是指什麼？
2024-07-17
大模型
CRM對企業有什麼用？如何在實踐中有效應用CRM系統？
2024-11-13
什麼是分佈分析？如何應用實踐？
2022-09-27
企業為什麼要實施供應商管理？
2022-07-18
Xinference實戰指南：全面解析LLM大模型部署流程，攜手Dify打造高效AI應用實踐案例，加速AI專案落地程序
2024-08-16
大模型AI
大語言模型的應用探索—AI Agent初探！
2024-07-08
模型AI
企業管理的核心是什麼？
2021-11-25
LLM應用實戰：當圖譜問答(KBQA)整合大模型(三)
2024-06-12
大模型
什麼是應用分發？
2022-03-11