國產大模型公司階躍星辰近日迎來一項重要技術里程碑。其最新推出的輕量級模型Step 3.7 Flash,在權威模型評測平臺Artificial Analysis的榜單上,一舉拿下速度、性價比和端到端表現三項核心指標的第一名。這一成績不僅讓Step 3.7 Flash在眾多國際主流模型中脫穎而出,也再次驗證了國內團隊在模型推理效率優化上的工程實力。
根據Artificial Analysis公佈的數據,Step 3.7 Flash的生成速度達到每秒超過200個token,遠超多數同級別模型。在衡量經濟性的性價比維度上,該模型的輸入成本為每百萬token 0.005美元,輸出成本為每百萬token 0.01美元,合計成本極低。端到端表現則綜合評估了從用戶發出請求到完整響應返回的全程時延與質量,Step 3.7 Flash同樣位列榜首。相比之下,OpenAI的GPT-4o mini、Anthropic的Claude 3.5 Haiku等輕量級模型在這幾項指標上均被拉開差距。
階躍星辰此前已推出Step系列多款模型,覆蓋從千億參數大模型到輕量級Flash版本。Step 3.7 Flash延續了該系列在數學推理、代碼生成和通用對話上的能力,同時通過模型架構優化、量化技術和推理引擎加速,實現了速度與成本的極致平衡。該模型主要面向需要低延遲、高併發的應用場景,如智能客服、實時翻譯、代碼補全和邊緣設備部署。
從產業背景看,模型推理成本一直是AI應用大規模落地的核心瓶頸之一。儘管過去兩年大模型能力飛速提升,但高昂的API調用費用和延遲問題仍讓許多開發者望而卻步。Artificial Analysis榜單自推出以來,已成為衡量模型實際部署價值的重要參考,其性價比和速度排名直接影響開發者的選型決策。此前,這一榜單的領先位置多由海外廠商佔據,國產模型此次登頂,反映出國內在模型工程化落地上的快速追趕。
在黃仁勳提出的“五層蛋糕”框架中,Step 3.7 Flash的突破直接作用於模型層,並通過降低推理成本對上層應用形成強力拉動。更便宜的API意味著AI原生應用、Agent、內容生成工具等可以以更低成本服務更多用戶,加速商業化閉環。同時,推理效率的提升也間接降低了對底層算力芯片的依賴,使得同等算力資源能支撐更大規模的用戶請求,優化基礎設施層的整體效率。
不過,也需看到,輕量級模型在複雜推理、長上下文理解和多模態能力上仍與大參數模型存在差距。Step 3.7 Flash的領先更多體現在工程優化層面,而非基礎能力的全面超越。未來,隨著更多國產模型在性能與效率上持續迭代,全球模型市場的競爭格局或將進一步重塑。對於AI產業投資者而言,模型層性價比的快速提升,意味著應用層的爆發可能比預期更早到來,但同時也可能加劇模型廠商之間的價格競爭,壓縮利潤空間。