構建RAG應用-day02: prompt技巧總結 llamaIndex入門

passion2021發表於2024-04-21

原文網址 : https://www.cnblogs.com/passion2021/p/18148497

常見 prompt 技巧

# 兩個原則
1.明確且具體的指令
    具體的指令不等於短指令，長指令往往能提供更高的清晰度
    1.使用分隔符劃分不同的文字內容
    2.請求模型輸出HTML或者JSON格式
    3.使用類似於異常捕獲的理念，教會模型處理文字中遇到的不同情況
    4.給模型提供少量示例，相當於讓模型模仿著示例來進行任務。

2.給模型時間去思考
    讓更多的計算資源分配到我們想讓模型做的事情上。
    1.對一個複雜任務，將其拆分為多個步驟，這一目的是給模型提供更高的清晰度。對於每個步驟還可以再次細化，直到模型給出理想的結果。
    2.不要讓模型短時間的去下一個結論，而是請求模型在提供最終答案之前進行一系列相關的推理，然後再給出結論。

# 幻覺
模型在訓練過程中接觸了大量的知識，它並沒有完全記住所見的資訊，因此它並不很清楚自己知識的邊界。這意味著它可能會嘗試回答有關晦澀主題的問題，並編造聽起來合理但實際上並不正確的答案。我們稱這些編造的想法為幻覺。
也就是說對於模型不清楚的知識，模型更傾向於一本正經的胡說八道。

# prompt技巧：
結構化輸入：角色 + 場景 + 思維鏈 + 回覆示例

# 少樣本提示
few-shot是普通的禁止指令的上位替代。與其告訴模型不能做什麼，不如提供示例，告訴模型怎麼做。如果一個例子的效果不好，可以嘗試用多個。

# 思維鏈：
相當於把問題的解法給llm
Let's think step by step.

# ReAct 
讓模型去推理，推理的過程中自己決定呼叫哪個工具。再把工具結果告訴模型，模型再次推理下一步。
可以透過某個引數，讓大模型輸出xx內容時，停下來。

# ReAct類比程式設計師的開發過程
需求 寫程式碼 執行程式碼看結果 改程式碼 執行程式碼看結果
think react think react

llamaIndex

LlamaIndex 是一個框架，用於構建稱為檢索增強生成 (RAG) 的系統。
構建RAG系統，需要先將文字轉化為向量表示,(這個過程被llamaIndex稱為索引)，然後將使用者的問題（query）進行向量相似度計算（這個過程被llamaindex稱為查詢）,匹配出和使用者問題最相關的資訊，最後傳入大模型，以提高llm的輸出效果。

入門示例一篇文章的RAG

安裝： pip install llama-index

import openai
import logging
import sys
import os.path
from llama_index.core import (
    VectorStoreIndex,
    SimpleDirectoryReader,
    StorageContext,
    load_index_from_storage,
)

# https://github.com/chatanywhere/GPT_API_free
openai.base_url = 'https://api.chatanywhere.tech/v1'

# 使用日誌檢視內部詳細行為
logging.basicConfig(stream=sys.stdout, level=logging.INFO)  # INFO/DEBUG
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))

# 檢查是否已經存在儲存空間
PERSIST_DIR = "./storage"
if not os.path.exists(PERSIST_DIR):
    # 載入data目錄下的文章
    documents = SimpleDirectoryReader("data").load_data()
    # 進行embedding
    index = VectorStoreIndex.from_documents(documents)
    # 儲存起來以後使用
    index.storage_context.persist(persist_dir=PERSIST_DIR)
else:
    # 載入現有索引
    storage_context = StorageContext.from_defaults(persist_dir=PERSIST_DIR)
    index = load_index_from_storage(storage_context)

# 初始化搜尋引擎
query_engine = index.as_query_engine()
# 搜尋 "作者的成長經歷是什麼?" 這裡向大模型提問了，顯然： 預設情況下，LlamaIndex 帶有一組經過實戰考驗的內建提示
response = query_engine.query("What did the author do growing up?")
# The author worked on writing short stories and programming, particularly on an IBM 1401 computer in 9th grade using an early version of Fortran. Later, with the availability of microcomputers, the author continued programming, eventually getting a TRS-80 computer and writing simple games and a word processor.
# 作者曾寫過短篇小說和程式設計，特別是在9年級的IBM 1401計算機上使用早期版本的Fortran。後來，隨著微型計算機的出現，作者繼續程式設計，最終得到了一臺TRS-80計算機，並編寫了簡單的遊戲和文書處理器。
print(response)

大概有如下步驟：讀取檔案 - 分塊 - 將文字向量化 - 匹配與問題最相關的文字 - 帶著這些文字和gpt聊天

檢視儲存的內容：

構建RAG應用-day03: Chroma入門本地embedding 智譜embedding
2024-04-23
檢索增強生成(Retrieval-augmented Generation,RAG)實戰1-基於LlamaIndex構建第一個RAG應用
2024-03-02
AIIndex
LlamaIndex RAG 和ReAct結合使用
2024-05-22
AIIndexReact
LLM學習(四)——構建 RAG 應用
2024-04-24
Prompt進階系列4:LangGPT(構建高效能Prompt實踐指南)--結構化Prompt
2024-03-22
GPT
Prompt進階2:LangGPT(構建高效能Prompt策略和技巧)--最佳實踐指南
2024-03-13
GPT
Prompt工程師指南[應用篇]：Prompt應用、ChatGPT|Midjouney Prompt Engineering
2023-05-15
工程師ChatGPT
RAG應用
2024-11-24
構建RAG應用-day06: 個人知識庫助手專案
2024-04-29
玩轉python？一文總結Python入門到進階的竅門和技巧！（建議收藏）
2020-11-09
Python
快速入門：構建您的第一個 .NET Aspire 應用程式
2023-11-16
【Android開發入門教程】二.Android應用程式結構分析
2020-07-22
Android
RAG實戰5-自定義prompt
2024-03-11
Langchain 與 LlamaIndex：LLM 應用開發框架的比較與選用建議
2024-07-20
LangChainIndex框架
構建RAG應用-day04-將LLM 接入 LangChain 構建檢索問答鏈部署知識庫助手
2024-04-25
LangChain
vue 入門總結
2018-11-21
Vue
Nuxt入門總結
2018-09-18
UX
pyFlink 入門總結
2024-05-13
React入門總結
2019-01-31
React
RAG應用評估
2024-11-24
構建小程式總結
2020-05-10
Flink從入門到放棄(入門篇2)-本地環境搭建&構建第一個Flink應用
2019-03-03
Android入門教程 | 使用 ConstraintLayout 構建自適應介面
2021-10-31
AndroidAI
京淘專案總結day02
2020-10-29
各種內建函式技巧總結
2024-11-16
函式
構建RAG應用-day01: 詞向量和向量資料庫文件預處理
2024-04-17
資料庫
RAG應用開發實戰(01)-RAG應用框架和解析器
2024-04-11
框架
構建 API 應用
2020-05-30
API
HTTPS入門級總結
2018-09-22
HTTP
測試入門總結
2020-12-15
文盤rust--使用 Rust 構建RAG
2024-10-08
Rust
使用 Rust、OpenAI 和 Qdrant 構建 Agentic RAG
2024-06-19
RustOpenAI
Prompt進階3:LangGPT(構建高效能質量Prompt策略和技巧2)--穩定高質量文案生成器
2024-03-13
GPT
用VIPER構建iOS應用
2018-04-28
iOS
CSS揭祕實用技巧總結
2020-04-07
CSS
教你構建一個優秀的SD Prompt
2024-04-10
使用 webpack 構建應用
2019-03-01
Web
RAG實戰2-如何使用LlamaIndex儲存和讀取向量
2024-03-06
AIIndex

構建RAG應用-day02: prompt技巧總結 llamaIndex入門

常見 prompt 技巧

llamaIndex

入門示例 一篇文章的RAG

相關文章

入門示例一篇文章的RAG