剛剛,DeepSeek官方釋出R1模型推薦設定,這才是正確用法

机器之心發表於2025-02-14
自春節以來,DeepSeek 就一直是 AI 領域最熱門的關鍵詞,甚至可能沒有之一,其官方 App 成為了史上最快突破 3000 萬日活的應用。最近一段時間,各家 AI 或雲服務廠商更是掀起了部署 DeepSeek-R1 服務的狂潮,甚至讓薅羊毛的使用者們都有點忙不過來了。

就在剛剛,DeepSeek 官網 X 帳號終於更新了(上一次更新還是在 1 月 28 日),官方下場推薦了部署 DeepSeek-R1 的設定。DeepSeek 強調官方部署的版本跟開源版本模型完全一致。
圖片
剛剛發出,就吸引了全網圍觀。
圖片
內容不多,分為四項。

第一項是:不要使用系統提示詞。這個建議其實已經被很多開發者提出過了。
圖片
第二項是:溫度引數設定為 0.6。至於原因,DeepSeek-R1 專案中寫到:「將溫度設定在 0.5-0.7 範圍內(建議為 0.6),以防止無休止的重複或不連貫的輸出。」

第三項,DeepSeek 分享了用於搜尋和檔案上傳的官方提示詞。

對於檔案上傳,建議使用者按照模板建立提示,其中 {file_name}、{file_content} 和 {question} 是引數。

filetemplate = \
"""[file name]: {filename}
[file content begin]
{file_content}
[file content end]
{question}"""

對於網頁搜尋,引數包括 {search_results}、{cur_data} 和 {question} 。

對於中文查詢,使用的提示詞是:
圖片
對於英文查詢,使用的提示詞是:
圖片
第四項則是一個指南,說明了可以如何緩解模型繞過思考的問題。DeepSeek 寫到:「我們觀察到 DeepSeek-R1 系列模型在響應某些查詢時傾向於繞過思考模式(即輸出 <think>\n\n</think>),這可能會對模型的效能產生不利影響。為了確保模型進行徹底的推理,我們建議強制模型對每個輸出都以 <think>\n 為其響應的開頭。」

雖然這一次實際上就只是更新了 DeepSeek-R1 專案的 README.md 檔案,但依然收穫了不少好評。
圖片
當然,也有使用者對 DeepSeek 官方推薦的設定有所困惑:
圖片
最後,雖然這種開源奉獻精神令網友們感動,不過,大家當前最大的痛還是這個:
圖片
參考連結:
https://x.com/deepseek_ai/status/1890324295181824107
https://github.com/deepseek-ai/DeepSeek-R1

相關文章