吳恩達最新短課,知識很硬核,附中英字幕
簡介
大家好我是老章,吳恩達老師忠實粉絲
之前刷過他的很多課程:
最近吳老師又限時免費開放了一個短課:《構建和評估高階 RAG 應用程式》
該課程由由 llama_index 和 truera_ai的 jerryjliu0和 datta_cs 教授主講,門檻很低,有 Python 基礎知識即可學習。
官網沒有中文字幕,所以我用ai翻譯並重新壓制了中英文字幕版上傳B站了
https://www.bilibili.com/video/BV1Cu4y1g7gG/
課程主題
本短課預計需要2個小時可以學完,內容包括:
-
學習句子視窗檢索等方法。
-
瞭解評估最佳實踐以簡化流程,並迭代構建強大的系統。
-
深入研究 RAG 三元組來評估LLM回答的相關性和真實性:上下文相關性、接地性和答案相關性。
-
句子視窗檢索和自動合併檢索,不僅檢索最相關的句子,還檢索圍繞該句子的句子視窗,以獲得更高質量的上下文,將 RAG 管道的效能提高到基線以上。
-
自動合併檢索,將文件組織成分層樹結構,其中每個父節點的文字在其子節點之間分割。根據子節點與使用者查詢的相關性,這可以讓您更好地決定是否應將整個父節點作為上下文提供給 LLM。
-
用於單獨評估 RAG 關鍵步驟質量(上下文相關性、答案相關性、接地性)的評估方法,以便您可以執行錯誤分析,確定管道的哪一部分需要工作,並系統地調整元件。
課程配套完整的程式碼和影片講解:
RAG是什麼?
當前大模型的問題是其訓練資料極其廣泛,當我們讓其完成特定領域的特定問題時,其回答可能存在事實不準確(幻覺)情況。針對特定問題進行微調可以一定程度上解決問題,但是成本高昂。檢索增強生成(RAG)應運而生,RAG是為LLM提供來自外部知識源附加資訊的概念,這使它們能夠生成更準確和更符合上下文的答案,同時減少幻覺。
普通 RAG 工作流程如下圖所示:
- 檢索:使用者查詢用於從外部知識源檢索相關上下文。為此,使用嵌入模型將使用者查詢嵌入到與向量資料庫中的附加上下文相同的向量空間中。這允許執行相似性搜尋,並返回向量資料庫中最接近的前 k 個資料物件。
- 增強:使用者查詢和檢索到的附加上下文被填充到提示模板中。
- 生成:最後,檢索增強提示被饋送到 LLM。
開發RAG應用有多種技術路線,這個課程使用了OpenAI嵌入模型在 Python 中實現 RAG 管道,使用TruLens做語言模型應用評估,LlamaIndex做編排。四個章節,配套完整程式碼,一步一步實現RAG 應用程式。
有志於從事大模型開發的同學,學起來吧。