剛剛,DeepSeek官方釋出R1模型推薦設定,這才是正確用法
机器之心發表於2025-02-14
自春節以來,DeepSeek 就一直是 AI 領域最熱門的關鍵詞,甚至可能沒有之一,其官方 App 成為了史上最快突破 3000 萬日活的應用。最近一段時間,各家 AI 或雲服務廠商更是掀起了部署 DeepSeek-R1 服務的狂潮,甚至讓薅羊毛的使用者們都有點忙不過來了。就在剛剛,DeepSeek 官網 X 帳號終於更新了(上一次更新還是在 1 月 28 日),官方下場推薦了部署 DeepSeek-R1 的設定。DeepSeek 強調官方部署的版本跟開源版本模型完全一致。第一項是:不要使用系統提示詞。這個建議其實已經被很多開發者提出過了。第二項是:溫度引數設定為 0.6。至於原因,DeepSeek-R1 專案中寫到:「將溫度設定在 0.5-0.7 範圍內(建議為 0.6),以防止無休止的重複或不連貫的輸出。」第三項,DeepSeek 分享了用於搜尋和檔案上傳的官方提示詞。對於檔案上傳,建議使用者按照模板建立提示,其中 {file_name}、{file_content} 和 {question} 是引數。"""[file name]: {filename}
對於網頁搜尋,引數包括 {search_results}、{cur_data} 和 {question} 。第四項則是一個指南,說明了可以如何緩解模型繞過思考的問題。DeepSeek 寫到:「我們觀察到 DeepSeek-R1 系列模型在響應某些查詢時傾向於繞過思考模式(即輸出 <think>\n\n</think>),這可能會對模型的效能產生不利影響。為了確保模型進行徹底的推理,我們建議強制模型對每個輸出都以 <think>\n 為其響應的開頭。」雖然這一次實際上就只是更新了 DeepSeek-R1 專案的 README.md 檔案,但依然收穫了不少好評。當然,也有使用者對 DeepSeek 官方推薦的設定有所困惑:最後,雖然這種開源奉獻精神令網友們感動,不過,大家當前最大的痛還是這個:https://x.com/deepseek_ai/status/1890324295181824107https://github.com/deepseek-ai/DeepSeek-R1