大模型进入“Agent爆发前夜”：算力告急与资本开支狂潮下的产业新周期

首页国际国内

投稿注册登录

2026-02-24 11:59 作者：公众号：港美通讯收藏(0) 评论(0)

人工智能大模型

2026年开局，人工智能赛道并未如市场此前担忧的那样陷入“技术空窗期”，反而迎来了一场史无前例的密集迭代。从Anthropic的Claude系列到国内的智谱GLM-5、Kimi K2.5，再到谷歌Genie的惊艳亮相，大模型的能力竞赛已从单纯的参数堆砌，全面转向多模态与智能体（Agent）的实战能力。

　　然而，这场技术盛宴的背后，一场关于算力“通胀”的危机正在蔓延。模型与应用的双重爆发，正将云计算和算力基础设施推向供需失衡的边缘，而全球科技巨头用万亿美元级别的资本开支，为这个“算力为王”的时代写下了最有力的注脚。

　　PART 01

　　Agent爆发倒计时：从“对话”到“干活”的质变

　　2026年初的模型迭代呈现出鲜明的特征：实用性。

　　海外巨头率先垂范，Anthropic陆续发布了Claude Excel、PPT Agent等一系列专注于办公场景和企业法务的工具，预示着AI正式进入企业级工作流。谷歌则通过Project Genie打开了“世界模型”的想象空间，用户不仅能探索，更能实时修改AI生成的虚拟世界，同时将Gemini 3深度整合进Chrome桌面端，意图抢占PC入口。

　　国内厂商的跟进速度同样惊人。智谱AI在近期发布了GLM-Image、GLM-OCR及旗舰模型GLM-5，后者凭借7440亿参数的规模以及在Coding（编程）与Agent能力上的开源SOTA表现，被海外博主实测代理编程能力位居世界前列。月之暗面的Kimi K2.5更是展现了惊人的商业化潜力，发布不到20天，累计收入便已超越2025年全年总和，验证了“超级应用”的吸金能力。

　　这种密集发布带来的直接后果，是对算力的“鲸吞”。据Gartner预测，从2025年到2026年，集成特定任务的AI Agent企业应用比例将从5%跃升至40%。到2028年，AI智能体将处理企业80%的常规工作流。当数以百万计的Agent开始7x24小时不间断运行、执行复杂的推理和多步骤任务时，算力需求的曲线变得前所未有的陡峭。

　　PART 02

　　算力“通胀”时代：云厂商涨价函与算力合伙人的无奈

　　需求的急剧膨胀，让算力侧出现了罕见的卖方市场。

　　今年1月下旬以来，算力紧缺的信号灯集体亮红。从海外巨头到国内龙头，涨价潮悄然来袭。谷歌云率先官宣自5月1日起对CDN、AI基础设施等服务进行价格上调，部分地区涨幅接近翻倍。国内方面，网宿科技、智谱等亦跟进了涨价策略。

　　最耐人寻味的信号来自智谱。2月16日，智谱官方宣布面向全网“寻找算力合伙人”，试图以此缓解供应链压力。这相当于公开承认，即便是头部大模型企业，也陷入了“有单不敢接、有模型跑不动”的算力饥渴症。此前，由于GLM-5发布后需求暴涨导致用户体验下滑，智谱甚至不得不公开发布道歉信并推出补偿方案。

　　这一幕似曾相识，却又意味深长。如果说过去两年的“算力紧缺”是源于对大模型训练的狂热，那么这一次的紧缺，则是源于“推理”和“应用”端的真实爆发。算力紧缺的性质，从“生产资料的短缺”演变为“消费品的供不应求”。

　　PART 03

　　巨头“梭哈”：6500亿美元的军备竞赛

　　面对这一局面，站在金字塔尖的科技巨头们选择用真金白银来表达对未来格局的判断。

　　根据近期披露的资本开支计划，亚马逊、微软、谷歌、Meta四家科技巨头2026年的资本支出总额预计将高达约6500亿美元（约合4.58万亿元人民币），这一数字接近日本全年的财政预算。

　　亚马逊以2000亿美元的预期支出拔得头筹，同比增幅超过52%；谷歌紧随其后，预计支出1750亿至1850亿美元，同比近乎翻倍；Meta同样激进，预计支出增长60%至近90% 。尽管微软的财年计算方式不同，但其第二财季高达375亿美元的资本支出已创下历史新高。

　　这些钱主要流向了服务器、数据中心和自研AI芯片。这种“不计成本”的投入在让投资者感到不安的同时（微软财报发布后股价单日暴跌10%），也揭示了一个残酷的现实：在AI时代，算力就是核心竞争力。谁拥有更强的算力底座，谁就能承载更复杂的模型、吸引更多的用户、迭代更快的应用。

　　PART 04

　　国产力量的“默契”：算力适配与成本革命

　　在这一轮全球AI竞赛中，国产算力并未缺席，反而通过深度适配找到了破局之道。

　　以智谱GLM-5为例，该模型发布后迅速完成了与七大主流国产芯片平台（华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、沐曦与燧原）的全面适配。这不仅是简单的兼容，而是深度的算力优化。

　　结果令人振奋：在单台国产算力节点上，GLM-5的性能表现已足以媲美由两台国际主流GPU组成的计算集群；在长序列处理场景下，部署成本更是大幅降低了50% 。这意味着，“国产模型+国产芯片”的组合正从“可用”走向“好用”，为受制于海外供应链的企业提供了极具性价比的替代方案。

　　这也为A股市场的相关标的注入了强劲的逻辑。作为国产CPU+GPU龙头，海光信息不仅深度绑定字节、腾讯、阿里等头部互联网厂商，其新一代产品深算四号进展顺利，成为国产算力中军。浪潮信息作为国产超节点龙头，已与20余家国产AI芯片厂商合作，其AIStation平台实现了30余款国产AI芯片的兼容，成为算力集成的关键枢纽。

　　PART 05

　　投资逻辑：寻找“稀缺”与“底座”

　　综上所述，2026年的AI投资主线已然清晰：

算力“通胀”下的受益者：随着云服务价格的上涨以及算力紧缺，拥有核心资源的企业议价能力增强。网宿科技、金山云等国产云服务商有望迎来业绩与估值的双击。

国产算力底座：在全球供应链不确定性依然存在的背景下，国产算力替代不再是“备胎”，而是必须承担起主力的重任。海光信息、浪潮信息作为硬件底座的核心供应商，将直接受益于国内智算中心的大规模建设。

成本优化与技术突破：模型厂商通过算法（如DSA稀疏注意力）和硬件适配（国产芯片）实现的成本降低，将反向刺激应用端的爆发。那些能够率先实现单位Token成本大幅下降、同时保持模型性能的企业，将在下一轮Agent落地潮中占据先机。

　　大模型的“iPhone时刻”已过，现在迎来的是“App Store时刻”。伴随着Agent的密集落地与算力的持续紧缺，一场关于应用生态与基础设施的深度变革，才刚刚拉开帷幕。对于投资者而言，在这一轮周期中，拥抱“稀缺”、拥抱“底座”，或许是最确定的策略。