是什麼
推理模型(Reasoning Models)是一類在給出最終答案前,會先生成一連串顯式「思考」步驟的大語言模型。它們通過在推理階段投入更多計算、逐步拆解問題,在數學、編程、邏輯等需要多步推導的任務上表現明顯更好。這一思路常被概括為「讓模型在回答前先思考」,即用推理時的額外計算換取更高的答案質量。
為什麼重要
推理模型代表了大模型能力提升的一條新路徑:不再只依賴把模型和訓練數據做大,也通過在推理階段投入更多算力來增強表現。這意味著算力消耗的重心從一次性的訓練,部分轉移到了每次回答都發生的推理環節,從而抬高了對推理算力和能源的長期需求,改變了下層基礎設施的負載結構。
與五層蛋糕的關係
推理模型處在「五層蛋糕」的「模型」層。它的「多想一會兒」特性,直接放大了對「基礎設施」與「芯片」層推理算力的消耗,使下層需求不再集中於訓練。向上,它讓「應用」層在複雜任務上獲得更可靠的能力,但也意味著每一次調用都要為更多的底層計算與電力埋單。
相關模型價格
推理模型因「思考」步驟會消耗更多輸出 token,輸出價往往是其性價比的關鍵。各推理模型的 API 價格與上下文窗口可在本站大模型庫對比——如 DeepSeek R1、Kimi K2 Thinking。