云基础设施

AI基础设施淘金热:为什么投资者押注数十亿美元于云计算的下一代

JP
Jennifer Park · 2026年1月29日 · 阅读时长9分钟

当所有人都专注于AI模型和应用时,基础设施层正在发生一场更安静的革命。风险投资家向初创公司投入前所未有的资金,这些公司承诺让AI部署更快、更便宜、更易访问——直接挑战云计算的既定企业。

数字讲述了一个引人注目的故事。旧金山的云平台Railway刚刚筹集了1亿美元,尽管在营销上花费了零美元。Listen Labs在短短九个月内获得了6900万美元资金,估值达到5亿美元。世界各国政府承诺到2030年向"AI主权"基础设施投入1.3万亿美元。在如何构建和部署技术方面,正在发生根本性的转变。

这不仅仅是另一轮基础设施投资。AI的繁荣暴露了为早期计算时代设计的云平台的结构性限制。这为初创公司创造了重新思考关于开发人员与基础设施互动的基本假设的机会,投资者正在急于资助赢家。

为什么传统云服务正在挣扎

Amazon Web Services于2006年推出,其设计基本上围绕虚拟机和存储桶。Google Cloud和Microsoft Azure遵循类似的模式。这些平台在当时是革命性的,但它们不是为现代AI应用的需求而构建的。

训练大型语言模型需要以最小延迟协调数千个GPU。大规模运行推理需要与传统Web应用不同的优化模式。构建AI功能的开发人员需要原生理解这些工作负载的基础设施,而不是通过复杂配置调整的通用计算资源。

"AWS是为按小时租用服务器和垂直扩展的时代而构建的。AI应用需要的基础设施能够跨专用硬件以毫秒级协调水平扩展。这是一个根本不同的架构。" — Jake Cooper, Railway首席执行官

在传统云平台上部署AI应用的复杂性已经在开发人员中造成了挫败感。设置GPU实例、为分布式训练配置网络、管理模型工件和优化推理端点需要许多开发团队不具备的专业知识。这种摩擦为抽象复杂性而不牺牲控制权的平台创造了机会。

开发体验革命

Railway的成功说明了这一机会。该平台通过解决一个简单问题吸引了200万开发人员,而没有任何营销支出:让部署真正变得简单。对于构建AI应用的开发人员来说,这比传统Web应用更重要。

考虑一个使用检索增强生成构建聊天机器人的开发人员。在AWS上,这涉及:设置EC2实例或Lambda函数、配置RDS数据库、部署像Pinecone这样的向量数据库、设置API Gateway、跨服务管理环境变量、实现监控和配置自动扩展。每个步骤都有多个配置选项和潜在的故障点。

在为AI时代设计的较新平台上,同一个开发人员可能:将代码推送到存储库、指定一些环境变量、然后部署。平台处理基础设施配置、扩展、监控和优化。这种复杂性的差异不是边缘性的——这是在基础设施上花费几天与立即专注于应用逻辑之间的区别。

近期AI基础设施投资亮点

  • Railway: 1亿美元B轮,专注于对开发人员友好的云基础设施
  • Listen Labs: 6900万美元B轮,估值5亿美元,AI驱动的客户研究工具
  • CVector: 500万美元用于工业AI基础设施
  • Obvious Ventures Fund V: 3.6亿美元专注于可持续技术基础设施
  • 全球政府承诺: 到2030年向AI基础设施投入1.3万亿美元

芯片层竞争

基础设施投资不仅关于软件平台。AI应用的激增正在推动对专用硬件的前所未有的需求,在整个供应链中创造机会。

微软最近宣布了其用于AI推理的Maia芯片,拥有超过1000亿个晶体管,提供10 petaflops的4位精度性能。这遵循了Google(TPU)、亚马逊和Meta的类似定制芯片工作。即使传统上专注于软件的公司也在投资硬件以优化AI工作负载。

这种垂直整合反映了经济现实:AI推理和训练成本主要由计算费用主导。大规模运行AI的公司可以通过优化从硅到软件的完整堆栈来实现大幅成本节约。对于基础设施初创公司来说,这既创造了机会(访问更好的硬件),也带来了挑战(与垂直整合的巨头竞争)。

ASML,制造用于生产先进芯片的设备的公司,最近报告了创纪录的订单——这是一个领先指标,表明尽管对泡沫动态的担忧,芯片制造商仍在大力押注AI基础设施的持续增长。

数据中心扩张

物理基础设施也看到了大规模投资。训练前沿AI模型需要专门为高密度GPU安装设计的数据中心,具有专门的冷却和电力传输。

弗吉尼亚州拥有美国最高浓度的数据中心,最近的冬季风暴测试了这些设施的弹性。当数据中心在供暖需求激增的同时消耗大量电力负荷时,批发电力价格飙升。这突显了一个日益增长的紧张关系:AI数据中心正在给现有电网带来压力,需要远超技术公司本身的基础设施升级。

据报道,Meta在各城市花费了640万美元用于广告活动,以建立对新数据中心建设的支持。这种公共关系投资反映了真正的挑战:当地社区担心电力消耗、环境影响以及高度自动化设施带来的当地经济益处有限。

数据中心的扩张也突显了AI基础设施访问的不平等。拥有资本建设专门设施的公司和国家在AI能力方面获得显著优势。这推动了"AI主权"运动,各国政府投资于国内基础设施以确保战略技术独立。

为什么投资者深信不疑

风险投资对AI基础设施的热情源于几个趋同的因素:

市场规模: 每家公司都在成为AI公司,这意味着每家公司都需要AI基础设施。总可寻址市场基本上是整个技术部门。

可防御性: 基础设施业务通常表现出强大的网络效应和转换成本。一旦公司在特定平台上构建,迁移既昂贵又有风险。

时机: 当前的云平台一代不是为AI工作负载设计的。在既有企业完全适应之前,有机会构建更好的解决方案。

利润潜力: 基础设施业务一旦达到规模就可以实现出色的单位经济学,特别是如果它们控制从硬件到开发工具的完整堆栈。

"我们看到了2000年代云计算发展的相同模式。新的计算范式创造了对新基础设施的需求,有一个短暂的窗口期,初创公司可以在既有企业调整之前确立自己。赢家将是那些在实现运营效率的同时掌握开发体验的公司。" — Sarah Tavel, Benchmark普通合伙人

风险和现实

尽管投资者热情高涨,但AI基础设施初创公司面临着真正的挑战。最明显的是来自资金极其雄厚的既有企业的竞争。AWS、Google Cloud和Azure拥有庞大的现有客户群、广泛的销售团队以及将AI服务与其他产品捆绑的能力。

还有一个问题是当前AI应用繁荣是否会持续。如果AI采用放缓或围绕少数用例整合,对专用基础设施的需求可能无法证明对该部门的投资是合理的。

资本密集度带来了另一个挑战。在盈利之前,构建基础设施业务需要在硬件、数据中心和工程方面进行大量前期投资。这在强劲的风险投资环境中效果良好,但如果资金条件收紧就会变得有风险。

监管不确定性增加了复杂性。各国政府开始监管AI应用,这可能会影响基础设施要求。数据驻留规则、模型治理标准安全法规可能倾向于某些架构方法而非其他方法。

对更广泛技术生态系统的影响

基础设施投资浪潮的影响超出了直接获得资金的公司:

对于开发人员: 更好的基础设施工具意味着更少的时间管理服务器,更多的时间构建应用。构建复杂AI功能的障碍正在迅速下降。

对于企业: 更多的基础设施竞争应该会降低成本并提高服务质量。公司将拥有三大云提供商之外真正的替代方案。

对于既有企业: AWS、Google Cloud和Azure面临改善开发体验和AI特定功能的压力,否则可能会在新项目中失去关注度。

对于整个AI行业: 更好的基础设施加速应用开发,这推动更多基础设施需求——一个造福整个生态系统的良性循环。

前进之路

并非每个AI基础设施初创公司都会成功。历史表明,基础设施市场往往趋向整合,少数大赢家和许多收购或失败。问题是什么方法将被证明最有价值。

专注于开发体验的公司现在有势头,但保持这一优势需要持续创新,因为竞争对手会模仿好主意。在成本上差异化的初创公司需要证明他们能够实现比拥有大规模现有优势的既有企业更好的单位经济学。

最有趣的机会可能在于垂直专用基础设施——为特定行业或用例优化的平台,而不是通用计算。医疗保健AI与金融服务AI有不同的要求,后者又不同于制造业AI。深刻理解领域要求的专用平台可以开辟可防御的位置。

无论发生什么,未来几年将决定AI时代的基础设施层。做对的公司不仅会建立成功的企业——它们还将塑造AI在整个经济中开发和部署的方式。这就是为什么投资者押注数十亿美元以获得正确答案。