影像資料不足時的處理方法
一個模型所能提供的資訊一般來源於兩個方面,一是訓練資料中蘊含的資訊;二是在模型的形成過程中(構造,學習,推理),人們提供的先驗資訊。訓練資料不足時,說明模型從從原始資訊獲取的資訊比較少,要想保證效果,就要更多的先驗資訊。先驗資訊可以作用在模型上,例如讓模型採用特定的內在結構,條件假設;先驗資訊也可以直接施加在資料集上,即根據特定的先驗假設去調整,變換或擴充套件訓練資料,讓其展現出更多更有用的資訊,以利於後續模型的訓練和練習。
我們知道訓練資料不足主要表現在過擬合方面,模型可能在訓練樣本上的效果不錯,但是在測試集上的泛化效果不好。對於上述討論,可以分為兩類。
一,基於模型的方法,主要是採取降低過擬合的措施,包括簡化模型(L1/L2正則項),整合學習,Dropout超參
二,基於資料的方法,主要通過資料擴充,即根據一些先驗知識,在保持特定資訊的前提下,對原始資料進行適當變換達到擴充資料集的效果。具體到影像分類可以:
1.一定程度內的隨機旋轉,平移,裁剪,填充,左右翻轉,這些變換對應著同一個目標在不同角度的觀察結果。
2.對影像中的畫素新增噪聲擾動,比如椒鹽噪聲,高斯白噪聲。
3.顏色變換,在影像的RGB顏色空間上進行主成分分析,得到3個主成分的特徵向量p1,p2,p3及其對應的特徵值,然後在每一個畫素的RGB值上新增增量
4.改變影像的亮度,清晰度,對比度,銳度等
使用生成模型,GAN
藉助已有的其他模型或資料來進行遷移學習。對於大部分圖片分類任務,並不需要從頭開始訓練模型,二是借用一個在大規模資料集上預訓練好的通用模型,並在針對目標任務的小資料集上進行微調(fine-tune),這種微調操作就可以看成是一種簡單的遷移學習。
相關文章
- Linux記憶體不足的處理方法Linux記憶體
- 影像預處理方法
- transforms模組—PyTorch影像處理與資料增強方法ORMPyTorch
- 影像處理開源資料集
- [影像處理] 基於CleanVision庫清洗影像資料集
- 醫學影像處理中的資料讀寫
- 時間序列資料的處理
- Jenkins臨時空間不足處理辦法Jenkins
- Mac影像後設資料處理器:MesaExifMac
- Python 影像處理 OpenCV (6):影像的閾值處理PythonOpenCV
- 處理恢復資料方法
- 影像處理--影像特效特效
- Python影像處理丨5種影像處理特效Python特效
- webgl 影像處理2---影像畫素處理Web
- 小程式處理大量資料列表的方法
- 資料預處理方法彙總
- Ai影像分割模型PaddleSeg——自定義資料集處理AI模型
- Python 影像處理 OpenCV (7):影像平滑(濾波)處理PythonOpenCV
- 影像預處理
- 大資料常見的處理方法有哪些大資料
- vue中當資料為空時的處理Vue
- Tensorflow 視窗時間序列資料的處理
- sklearn中常用資料預處理方法
- 實時資料處理:Kafka 和 FlinkKafka
- Python資料處理(二):處理 Excel 資料PythonExcel
- openCV中的影像處理 3 影像閾值OpenCV
- halcon的頻域影像處理
- 影像處理_切邊
- 前端影像處理指南前端
- OpenCV(影像NaN處理)OpenCVNaN
- 影像處理案例03
- 影像輪廓處理
- 擅長處理臨時資料的結構——棧
- 處理pandas讀取資料為nan時NaN
- 資料處理
- C# 優雅的處理TCP資料(心跳,超時,粘包斷包,SSL加密 ,資料處理等)C#TCP加密
- Spark在處理資料的時候,會將資料都載入到記憶體再做處理嗎?Spark記憶體
- SAP CRM中介軟體下載時資料庫表CRMATAB為空的處理方法資料庫