今日导读 今日AI产业呈现模型层与芯片层共振:美国政府即将解除对Anthropic模型Fable 5的访问禁令,同时博通与OpenAI联合推出定制推理芯片Jalapeño,九个月完成流片。模型层的进展正拉动算力需求,DeepSeek同日发布DSpark框架,使V4模型单用户生成速度提升最高85%,进一步降低推理成本。
美国政府即将允许Anthropic恢复其最新大模型Fable 5的访问权限。此前6月12日,美方以国家安全为由发出紧急出口管制指令,禁止外国主体访问Fable 5和Mythos 5,引发市场对AI概念股的担忧。Anthropic今年5月完成650亿美元H轮融资,估值达9650亿美元,为全球估值最高的AI初创企业。
为什么重要出口管制松绑直接牵动Anthropic估值叙事与AI算力板块情绪,其近万亿美元估值能否稳住取决于模型商业化通道是否畅通。
36氪
DeepSeek 与北京大学团队联合发布大模型推理加速框架 DSpark,采用半自回归架构与置信度调度验证,已部署于 DeepSeek-V4-Flash 和 V4-Pro 预览版生产系统。在真实线上流量中,DSpark 将 V4-Flash 单用户生成速度提升 60% 至 85%,V4-Pro 提升 57% 至 78%,并替代原有 MTP-1 方案。该框架同时开源模型权重与训练代码库 DeepSpec。
为什么重要DSpark 通过动态调度验证预算,在高并发场景下显著提升大模型推理效率与系统吞吐,直接影响 AI 应用层的用户体验与基础设施层的 GPU 利用率。
爱范儿 ifanr
DeepSeek创始人梁文锋挂名发表新论文《DSpark:基于置信度调度的推测解码与半自回归生成》,提出将投机解码与动态置信度调度结合,在不牺牲回答质量的前提下,将模型生成速度提升60%至80%,高峰并发下的吞吐量提高51%以上。该方案通过优先验证高置信度token,减少GPU算力浪费,有望根治DeepSeek长期被诟病的服务器卡顿与宕机问题,并进一步压低推理成本。
为什么重要该技术直接降低大模型推理成本,可能引发API降价或免费额度提升,同时开源训练框架DeepSpec将拉低全行业推理成本基准线,影响AI应用层的经济模型。
虎嗅
IBM于2026年6月25日宣布推出全球首款0.7纳米芯片,采用NanoStack三维堆叠架构,在指甲盖大小面积集成近1000亿个晶体管,性能提升50%、能效改善70%。但多位工程师指出,该命名仅为营销标签,实际结构中纳米片厚度约5纳米、层间距9纳米,并无0.7nm物理尺寸。马斯克呼吁改用“原子数量”定义制程节点,引发行业对纳米命名体系脱节的广泛讨论。
为什么重要该事件折射出芯片制程命名与物理尺寸长期脱节的行业共识危机,直接影响投资者对先进工艺技术进展的真实判断,并牵动台积电、三星等代工厂未来技术路线与商业化路径的评估。
虎嗅
博通与OpenAI联合发布定制AI推理芯片Jalapeño,专为大语言模型工作负载设计。该芯片是多代AI计算平台的首款产品,从设计到流片仅用约九个月,体现双方软硬件协同开发的高效。对关注博通(AVGO)的投资者而言,Jalapeño为其AI基础设施角色增添了新维度。
为什么重要此举强化博通在定制AI芯片领域的地位,并深化其与OpenAI的绑定,对AI算力供应链格局产生直接影响。
Yahoo Finance — AVGO 头条
该分层下当日暂无新闻。
← 只看今日精选新闻