OpenAI 推理成本减半冲击芯片股，费城半导体指数重挫 5%

OpenAI软件优化将推理成本减半，减少英伟达GPU需求，引发芯片股大跌。

周三，美国芯片股遭遇剧烈抛售，费城半导体指数（SOX） 单日跌幅约 5%，成为市场焦点。英伟达（NVIDIA） 下跌约 1.7%，AMD 跌幅达 5.4%，英特尔（Intel） 更是重挫 7.8%。这一轮下跌的直接导火索，是科技媒体 The Information 的一篇报道：OpenAI 的工程师团队发现了一系列软件优化方法，能够将大语言模型的推理成本削减一半以上。

报道指出，这些优化技术被应用于处理 ChatGPT 的非登录访客流量后，所需英伟达 GPU 的数量一度降至仅“几百块”，这一数字被该媒体形容为“惊人的少”。尽管具体的技术细节尚未公开，但报道提到了量化、键值缓存、批处理以及模型路由等可能的优化方向。这一突破迅速在华尔街引发连锁反应——投资者开始重新审视一个根本性问题：如果 AI 实验室能从已部署的芯片中压榨出数倍的算力，那么未来对新芯片的采购需求是否会大幅缩水？

此次抛售发生的背景，是半导体板块刚刚经历了一个历史性的季度。在 2026 年第二季度，仅 美光（Micron）、英特尔和 AMD 三家公司就合计增加了约 2 万亿美元的市值，投资者资金从英伟达向其他硬件股轮动。截至 6 月下旬，半导体公司在 标普 500 指数 中的权重已达到创纪录的 19.7%，几乎是 2020 年 6 月约 5% 权重的四倍。这意味着，任何有关需求侵蚀的风吹草动，都会对一个高度暴露于芯片情绪的指数产生不成比例的冲击。

加剧市场压力的还有来自 Meta 的消息。彭博社 同日报道称，Meta 正计划推出云计算业务，向外部客户出售 AI 算力。这一举动可能意味着 Meta 自身的芯片采购需求将放缓——若能将过剩产能转售给第三方，其继续大规模激进采购硬件的紧迫性或将降低。

在普跌行情中，博通（Broadcom） 的处境相对复杂。该公司是 OpenAI 定制 AI 推理芯片 “Jalapeño” 的合作伙伴，这款芯片专为大语言模型工作负载从头设计，计划于 2026 年底开始部署到数据中心。这种合作关系为博通提供了一种潜在的对冲手段，使其在面对纯 GPU 需求消退的担忧时，比竞争对手多了一层缓冲。

从 OpenAI 自身的财务状况来看，效率提升具有直接且重大的意义。截至 2026 年第一季度末，该公司的毛利率为 39%，虽较去年同期的 33% 有所提升，但距离其设定的年底前达到 52% 的目标仍有很大差距。要实现这一目标，OpenAI 在年内剩余月份的平均毛利率需达到 56%。推理成本的大幅削减有望显著缩小这一差距，但公司尚未公开表态是会将节省下来的成本转化为利润，还是通过降低 API 价格或提高查询上限的方式让利给客户。

这一效率突破的消息传出之际，OpenAI 正处于机密 IPO 进程中，已于 2026 年 5 月向监管机构提交了 S-1 文件。此前已有报道暗示该公司可能推迟上市，若毛利率改善的轨迹不及预期，将为推迟时间表提供更多理由；反之，若下半年毛利率能强劲向目标靠拢，则将有力支撑其面向潜在投资者的估值叙事。

展望未来，Jalapeño 芯片 在 2026 年底的部署将成为一次实战检验，验证软件优化与定制 ASIC 的结合能否在规模化层面系统性地降低英伟达在推理领域的份额。对于芯片投资者而言，周三的抛售究竟是市场对 AI 硬件需求的一次持久性重估，还是对一个此前看似坚不可摧的板块尾部风险的一次性重新定价，将是未来数月需要持续观察的核心命题。

OpenAI 推理成本减半冲击芯片股，费城半导体指数重挫 5%

延伸阅读

相关深度报道

相关每日新闻