DataWhale暑期夏令營第一期——大模型技術方向task2筆記

zakarRoman發表於2024-07-04

原文網址 : https://www.cnblogs.com/zakar/p/18282797

大模型筆記

Task 2 筆記

資料分析

可以先透過對標籤中各個項進行資料分析（使用values_count方法），可以得到主要任務的各個指標的值分佈情況。

我認為這一步的作用：

幫助理解資料。
大模型的本質還是機率生成，透過prompt提示詞去進行生成

Baseline最佳化思路

1.資料處理

角色合併：將同一個說話人的話合併。頻繁的角色轉換可能會增加大模型處理資料的困難。
- 個人預想的思路：可以對對話資料進行編號，將編號和對應語句封裝為一個tuple，將每個角色的所有語句進行合併，減少頻繁的角色轉換。
資訊清洗：去除一些不必要的資訊（表情，圖片，連結等，這些資料沒有關聯性，是無法解析的髒資料）
- 模型的主要任務還是從文字中提取關鍵詞
- 表情，圖片，連結並不是我們要提取的物件
- 去掉以上這些部分的影響不大，因為這些資訊本來就很難被大模型讀取
資訊總結：將聊天資訊總結（總結之後的資料有可能會對後續大模型的關鍵字抽取工作造成影響）
- 將聊天資訊總結為一段話或者其他形式，這樣做可能會提高資訊的可閱讀性。但是離開了真實的對話環境。
- 某些情況下，對聊天資訊進行預處理和總結可以減少噪聲，提高後續處理的效率。但這也取決於模型是否能夠從中獲益。

2.Prompt工程

- 任務資訊分析：在設計Prompt時，理解每個任務的資訊需求是非常重要的。這包括如何指導模型提取特定的資訊，並避擴音取不相關的資訊。
任務2～10:
- 可以根據任務1得到的客戶姓名以及資料分析中得到的值，讓llm去做選擇題，編寫出Prompt，讓大模型去執行
- 缺點：費token
調優：
- 使用訓練集去調優。
- 根據評價指標寫一個評價函式，讓大模型使用評價指標和標籤對抽取進行一個評價
調優思路：
1. 資料分析
2. 保留基本欄位資訊，其他欄位為空
3. 全部欄位為空（效果最好？）

問題

1. 為什麼全寫空，結果會好呢？

當資料中空值較多時，模型可能會學習到一種傾向，即忽略缺失或不確定的資訊。在這種情況下，如果測試集中的空值與訓練集類似，模型就會表現得更好，因為它能夠預期到這些缺失值。

2. 大模型提取出多餘資訊，如何解決？

可以透過後處理步驟來清理模型可能產生的多餘資訊。例如，在提取JSON資料時，可以設定一些規則來過濾掉不符合格式或邏輯的資訊。

3. Prompt原理？

在自然語言處理中，Prompt工程的核心思想是利用預先設計的指令和資訊來引導模型生成預期的輸出。在Transformer或BERT這樣的模型中，輸入的序列透過自注意力機制捕捉不同部分之間的關係，而好的Prompt可以更有效地引導模型關注於關鍵資訊，從而提高預測的準確性。

在多選題的Prompt設計中，q,k,v指的是query, key, value這三個元件，在注意力機制中起著關鍵作用。query用於查詢與之相關的資訊（key, value），而value則包含了實際的資訊內容。透過精心設計這兩個部分，可以提高模型處理特定任務的效能。

Datawhale X 李宏毅蘋果書 AI夏令營 Task2筆記
2024-08-31
蘋果AI筆記
Datawhale X 李宏毅蘋果書 AI夏令營 task2
2024-08-24
蘋果AI
大模型技術方向Task1筆記
2024-07-02
大模型筆記
Datawhale AI 暑期夏令營第四期Task3
2024-08-03
AI
Datawhale AI 夏令營第五期 CV方向 01
2024-08-26
AI
Datawhale X 魔搭 AI夏令營 AIGC方向 Task3
2024-08-17
AIGC
Datawhale X 魔搭 AI夏令營 AIGC方向 Task1
2024-08-11
AIGC
Datawhale X 李宏毅蘋果書AI夏令營 Task2打卡
2024-08-31
蘋果AI
Datawhale AI 夏令營-天池Better Synth多模態大模型資料合成挑戰賽-task2探索與進階(更新中)
2024-08-15
AI大模型
Datawhale AI 夏令營第五期 CV方向 02進階
2024-08-29
AI
Datawhale X 李宏毅蘋果書 AI夏令營 Task1.2 筆記
2024-08-27
蘋果AI筆記
Datawhale X 李宏毅蘋果書 AI夏令營task1筆記
2024-08-24
蘋果AI筆記
Datawhale X 魔搭 AI夏令營(三)
2024-08-17
AI
Datawhale Al夏令營——siRNA藥物藥效預測Transformer模型搭建嘗試
2024-08-03
ORM模型
Datawhale X 魔搭 2024年AI夏令營第四期AIGC方向 Task01
2024-08-11
AIGC
Datawhale AI夏令營-機器翻譯挑戰賽
2024-07-17
AI
[Datawhale AI 夏令營] Task1: 跑通YOLO方案baseline
2024-08-25
AIYOLO
DataWhale-2024夏令營第四期-從零入門AI生圖原理&實踐-學習筆記
2024-08-11
AI筆記
Datawhale AI夏令營-第四期(AIGC方向)-Task01-可圖Kolors-LoRA風格故事挑戰賽
2024-08-09
AIGC
Datawhale-爬蟲-Task2（正規表示式）
2019-03-02
爬蟲
2、實踐方法論（Datawhale X 李宏毅蘋果書 AI 夏令營）
2024-09-03
蘋果AI
大模型RAG技術
2024-06-27
大模型
Datawhale X 李宏毅蘋果書AI夏令營 Task3打卡
2024-09-03
蘋果AI
Datawhale X 李宏毅蘋果書AI夏令營深度學習進階(三)
2024-09-02
蘋果AI深度學習
Datawhale X 李宏毅蘋果書AI夏令營深度學習進階(二)
2024-08-30
蘋果AI深度學習
Datawhale X 魔搭 AI夏令營-第四期(AIGC方向)-Task02-可圖Kolors-精讀程式碼實戰進階
2024-08-14
AIGC
模型微調-書生浦語大模型實戰營學習筆記&大語言模型5
2024-04-16
大模型筆記
綜述 | 農業大模型：關鍵技術、應用分析與發展方向
2024-06-29
大模型
CSS技術筆記
2020-11-22
CSS筆記
大資料開發技術學習方向
2018-12-20
大資料
大資料領域三個大的技術方向
2019-05-13
大資料
CCF-阿里媽媽科技袋基金正式釋出，第一期聚焦大模型方向
2024-05-21
阿里大模型
Datawhale X 李宏毅蘋果書 AI夏令營 Task3 批次歸一化、卷積神經網路、自注意力機制原理筆記
2024-09-02
蘋果AI卷積神經網路筆記
大話儲存——磁碟原理與技術筆記（一）
2021-07-16
筆記
[SQL] Datawhale 學習筆記 Task04
2020-12-23
SQL筆記
前端融合方向技術棧
2019-05-07
前端
技術圈週刊｜谷歌釋出最新開源 AI 大模型 Gemma，筆記本上即可執行
2024-02-24
谷歌AI大模型Gemma筆記
2024廈門大學數學夏令營考核試題
2024-07-27

DataWhale暑期夏令營第一期——大模型技術方向task2筆記

Task 2 筆記

資料分析

Baseline最佳化思路

1.資料處理

2.Prompt工程

問題

1. 為什麼全寫空，結果會好呢？

2. 大模型提取出多餘資訊，如何解決？

3. Prompt原理？

相關文章