Deepmind最新研究：一個技巧，思維鏈不再需要提示詞激發了！

AIGC動態1年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：Deepmind最新研究：一個技巧，思維鏈不再需要提示詞激發了！
關鍵字：模型,路徑,提示,任務,能力
文章來源：夕小瑤科技說
內容字數：9526字

內容摘要：

夕小瑤科技說原創作者 | 松果、Python引言：探索無需特定提示的LLM推理能力在人工智能領域，大語言模型（LLMs）已經在各種復雜的推理基準測試中展現出了令人矚目的性能。傳統上，這些推理能力是通過精心設計的提示技術來激發的，例如少量示例提示（few-shot prompting）或零示例提示（zero-shot prompting）。然而，這些方法往往涉及到手動密集的提示工程，限制了它們在不同任務中的通用性。
本項工作探索了一個不同的視角，提出了一個關鍵的問題：LLMs能否在沒有特定提示的情況下有效地進行推理？研究發現一令人驚訝的結果，通過簡單地改變解碼過程，可以從預訓練的LLMs中自然地激發出鏈式推理（CoT）路徑。這種解碼修改繞過了CoT提示，并且是完全無監督的，不需要模型調整。
研究還揭示了預訓練語言模型固有的推理能力，這一發現與之前側重于改進提示以促進推理的研究形成了鮮明對比。研究發現，當模型在其解碼路徑中存在CoT時，對其最終答案的信心增加。利用這種增加的信心，研究者提出了CoT解碼方法，以選擇更可靠的解碼路徑，從而在各種推理基準測試中顯著提高了模型性能。
實驗結果表明

原文鏈接：Deepmind最新研究：一個技巧，思維鏈不再需要提示詞激發了！