得物大模型平臺,業務效果提升實踐
目錄
一、背景
二、大模型如何幫助業務提升效果
1. 大模型應用場景
2. 接入大模型的方式
三、基礎大模型選型
1. 業界提供的基礎大模型有哪些
2. 大模型的評測資料集主要有哪些
3. 如何做大模型的選型
四、資料準備
1. 大模型訓練需要哪些資料
2. 訓練資料如何準備
五、大模型訓練
1. 大模型都有哪些訓練方式
2. 訓練的過程
六、大模型部署
1. 目前的推理加速方案有哪些
2. 如何選擇推理加速方案
七、總結與展望
一
背景
得物大模型訓練與推理平臺上線幾個月後,我們與公司內部超過 10 個業務領域展開了全面的合作。在一些關鍵業務指標方面,取得了顯著的成效,例如:
效率相關部門的合作,多維度打標總正確率取得 2 倍以上提升。利用大模型開闢了新的業務,提升了效率部門的人力產出。 某業務訂單 NPS 的識別準確率由 70% (PROMPT 方式)提升到 85% (平臺訓練大模型) 。
二
大模型如何幫助業務提升效果
大模型應用場景
大語言模型是一種基於深度學習演算法的人工智慧技術,可以模擬人類的語言行為,並能夠從大量的文字資料中學習到語言的特徵和規律。其應用場景非常廣泛,以下是一些主要的應用場景:
接入大模型的方式
要接入大語言模型,主要有兩種方式:
三
基礎大模型選型
基礎大模型指的是各組織已經進行預訓練的大模型,這些模型通常是在大規模文字資料上進行了通用性的預訓練,可以作為基礎模型供其他任務的微調和特定應用程式使用。
業界提供的基礎大模型有哪些
業界的大模型可以分為閉源系列大模型,開源系列大模型。
閉源系列大模型通常透過 API 介面與聊天頁面等方式提供大模型服務,例如 OpenAI 的 GPT 系列、Anthropic 的 Claude 系列、百度的文心一言系列等。對於閉源大模型,通常建議使用 PROMPT 提示的方式來與模型進行互動。如果需要進行微調訓練以適應特定任務或領域,一般建議使用開源大模型。
Llama2 系列,由 Meta 公司提供,開源了模型引數和訓練論文。 Llama2 生態系列,指的是各組織在 Llama2 的基礎上進行微調訓練,以獲得更好的效果,然後進一步將其開源。當前一些不錯的開源系列包括 Vicuna 系列、XinLM 系列、WizardLM 系列、UltraLM 系列等。 國內開源系列,國內一些廠商也會自己去訓練一些大模型開源,效果也不錯。比如:QianWen 系列,BaiChuan 系列等等。
大模型的評測資料集主要有哪些
既然有這麼多大模型可供選擇,我們如何確定哪些模型更為出色呢?這涉及對大模型效能進行評估。通俗來說,大模型的評估是指將各種不同場景的問題提供給模型進行回答,然後根據回答的質量來評分。
如何做大模型的選型
預訓練的大模型的應用可以分為通用模型和行業模型。在選擇基礎大模型時,使用者應該根據他們的具體應用場景以及各大模型的評測得分來做決策。
四
資料準備
大模型訓練需要哪些資料
大模型的訓練過程通常包括預訓練、指令調優和偏好學習。在選擇了預訓練的大模型後,您通常只需要進行業務微調,即指令調優和偏好學習。實際上,在大多數情況下,只進行指令調優就足夠了。
{ "instruction": "簡單解釋人工智慧的概念。", "input": "", "output": "人工智慧(Artificial Intelligence,簡稱AI)是指用計算機程式來模擬人類智慧的過程。它是一種能讓計算機或程式在執行任務時表現出類似人類智慧的技術。人工智慧包括了機器學習、自然語言處理、語音識別和計算機視覺等領埴。簡言之,人工智慧就是賦予計算機類似人類的思維和行為能力。" }
訓練資料如何準備
五
大模型訓練
大模型都有哪些訓練方式
預訓練:在這一階段,大模型利用大量語料庫進行自我學習,逐漸掌握自然語言處理的規律和技巧。這是為了建立一個通用的語言理解基礎。 指令調優:這個階段主要針對特定的業務場景進行訓練。透過提供大量指令和相應的反饋,大模型逐漸適應並解決特定問題。這個階段使模型更適應特定業務需求。 偏好學習:在大模型的訓練過程中,還要考慮偏好學習,使大模型的回答更加貼近人類的偏好,遵循人類的意圖。如語言風格和表達習慣等。
訓練的過程
選擇大模型。基於之前提到的大模型選擇原則,在大模型平臺上選擇您需要的大模型。 上傳訓練資料。按照上述資料準備方法,將您準備好的資料上傳到大模型平臺。 配置訓練引數。通常情況下,選擇預設配置引數,如 Lora 即可。這些引數通常經過最佳化以獲得最佳的訓練效果。 訓練。點選相應按鈕,啟動訓練過程。大模型平臺將自動處理訓練任務,以便您專注於業務應用的開發和部署。
六
大模型部署
目前的推理加速方案有哪些
量化:透過將模型引數量化為 8 位或 4 位,可以在保持模型效果的同時,加速推理過程,減少計算和記憶體開銷。一些常見的量化框架包括 AWQ 和 GPTQ。 視訊記憶體管理最佳化:大模型的運算通常會佔用大量視訊記憶體,特別是 KV Cache。透過視訊記憶體管理最佳化,如 Page Attention 技術,可以減少視訊記憶體碎片,提高視訊記憶體利用率。 Attention 運算最佳化:Attention 運算在計算時耗時較長,而且會導致大量的記憶體訪問。透過結合 GPU 硬體的特點,減少記憶體訪問和快取,可以加速 Attention 運算。一些技術如 Flash Attention 和 Group Query Attention 可以改進 Attention 效能。 運算元融合最佳化,透過合併大模型運算過程中的運算元,可以減少計算和記憶體開銷,從而提高推理速度。
如何選擇推理加速方案
七
總結與展望
我們在前面的內容中詳細分享了大模型的選擇、資料準備、訓練以及部署等方面的最新技術。未來,我們將進一步深入探討這些技術的細節。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70027824/viewspace-2998587/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 得物大模型平臺接入最佳實踐大模型
- 得物App資料模擬平臺的探索和實踐APP
- 得物前端巡檢平臺的建設和應用實踐前端
- 得物技術多興趣召回模型實踐模型
- 得物技術 NOC—SLA C 端業務監控實踐
- 得物染色環境落地實踐
- 有贊業務對賬平臺的探索與實踐
- 轉轉業務資料校驗平臺實踐分享
- 得物App ANR監控平臺設計APP
- 美團圖資料庫平臺建設及業務實踐資料庫
- “雙十一”購物節 電商平臺面臨的五大業務風險
- 得物商家域精準測試實踐
- 我是庖丁,<肢解IOT平臺>之物模型模型
- 美圖大資料平臺架構實踐大資料架構
- HBase 在統一內容平臺業務的最佳化實踐
- 得物自研API閘道器實踐之路API
- 得物社群 golang 灰度環境探索和實踐Golang
- JuiceFS 在大搜車資料平臺的實踐UI
- 智慧水務藉助物聯網平臺實現效能提升與智慧管理
- [平臺建設] HBase平臺建設實踐
- 中科大腦知識圖譜平臺建設及業務實踐
- 餘利華:網易大資料平臺架構實踐分享!大資料架構
- 企業大資料平臺MapReduce應用之Join實踐!大資料
- OPPO大資料診斷平臺設計與實踐大資料
- 魅族大資料之流平臺設計部署實踐大資料
- IoT平臺如何實現業務配置中心
- GPT大語言模型Vicuna本地化部署實踐(效果秒殺Alpaca)GPT模型
- 業務瘦身42%+效率提升50% :去哪兒網業務重構DDD落地實踐
- 得物複雜 C 端專案的重構實踐
- 得物技術時間切片的實踐與應用
- 得物資料庫中介軟體平臺“彩虹橋”演進之路資料庫
- 優酷弱網平臺落地實踐
- 360容器平臺監控實踐
- 如何擴充套件大模型的上下文長度|得物技術套件大模型
- 搜尋引擎分散式系統思考實踐 |得物技術分散式
- 前端監控穩定性資料分析實踐 | 得物技術前端
- 前端監控穩定性資料分析實踐|得物技術前端
- 訂單流量錄製與回放探索實踐|得物技術