【DeepSeek】一文搞懂 deepseek

666tester發表於2025-02-17

一、 DeepSeek API 接入步驟

1. 訪問官網,註冊賬號

  • 官網地址: https://www.deepseek.com/
  • 點選右上角的【註冊】,完成賬號建立
  • 登入賬號,點選右上角的 API 開放平臺,建立 API Key:

2. 呼叫 DeepSeek API 完成專案接入

  • 詳細 API 呼叫指南:https://api-docs.deepseek.com/zh-cn/guides/reasoning_model
  • 引數

  • 程式碼

    # Please install OpenAI SDK first: `pip3 install openai`
    
    from openai import OpenAI
    
    client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")
    
    response = client.chat.completions.create(
        model="deepseek-chat",
        messages=[
            {"role": "system", "content": "You are a helpful assistant"},
            {"role": "user", "content": "Hello"},
        ],
        stream=False
    )
    
    print(response.choices[0].message.content)
    
  • 錯誤碼

二、 Temperature 設定

1. 推薦值設定

2. 疑問

  • 什麼是 Temperature
  • 值的設定規則是什麼
  • 不同的值有什麼作用

三、 深度思考 R1

1. 簡要說明

  • 允許使用者透過蒸餾技術藉助 R1 模型訓練其他模型
  • 上線 API,對使用者開放思維鏈輸出,透過設定 model="deepseek-reasoner"即可呼叫
  • 在後訓練階段大規模使用了強化學習技術,在僅有極少標註資料的情況下,極大提高了模型推理能力
  • 在數學、程式碼、自然語言推理等任務上,效能比肩 OpenAIo1 正式版
  • 推理過程包含大量煩死和驗證,思維鏈長度可達數萬字
  • 論文地址:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

四、 聯網搜尋

1. 簡要說明

  • 在聯網搜尋模式下,模型將深入閱讀海量網頁,為使用者生成全面、準確、滿足個性化需求的回答
  • 面對使用者的複雜問題,模型將自動提取多個關鍵詞並行搜尋,在更短時間內提供更加多樣的搜尋結果

五、 本地部署

1. 參考

  • 連結:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

六、 其他

  • 在大模型 API 的使用場景中,使用者的輸入有相當比例是重複的。比如使用者的 prompt 往往有一些重複引用的部分。再比如在多輪對話中,每一輪都要將前幾輪的內容重複輸入
  • 為此 DeepSeek 啟用上下文硬碟快取技術,把預計未來會重複使用的內容,快取在分散式的硬碟陣列中
  • 如果輸入存在重複,則重複的部分只需要從快取讀取,無需計算。
  • 降低服務的延遲,大幅削減最終的使用成本

參考

  1. https://api-docs.deepseek.com/zh-cn/

相關文章