Etched融资冲到8亿美元:推理芯片开始走“定制化对抗NVIDIA”路径
AI芯片这条赛道过去几年有点固定叙事:训练端被NVIDIA锁死,推理端被云厂商慢慢消化,后来者要么做边缘补充,要么做细分加速卡,很少有人直接把“替代关系”写进商业模型。
Etched这次拿到约8亿美元融资,节奏就明显不太一样。投资方里出现Jane Street这种偏交易驱动的机构,本身就有一点信号意义——这类资本更关注算力效率和实际收益转化,而不是纯技术叙事。
10亿美元级别的销售合同已经提前挂出来,但客户没公开。这个结构在AI硬件行业并不罕见,尤其是推理芯片阶段。很多时候合同更像是一种“产能预定+验证绑定”,真正的大规模收入往往要等到几轮部署之后才会兑现。问题不在合同规模,而在能不能进入客户的真实推理流量链路。
Etched成立于2022年,时间不长,但定位很直接:做推理专用芯片,绕开通用GPU路径。它押的是一个正在发生的趋势——训练和推理开始分层。训练仍然依赖大规模GPU集群,但推理侧越来越像“持续运行的低成本服务市场”,单位token成本被压得更狠,也更敏感。
和TSMC的合作点在“低电压推理”上,这个说法比较工程化,但本质是能耗和散热的再优化。推理芯片的难点不在峰值算力,而在长期稳定运行时的能效曲线。尤其是在机架级部署里,电力、散热、密度之间的约束是硬边界,不是软件能完全解决的问题。
行业里其实已经出现一个隐约的分层:上层是大模型公司继续推参数规模,下层是推理基础设施开始做“成本压缩竞赛”。Etched切的就是后者。它不是在和GPU做功能对比,而是在尝试做“结构替代”。
但这个赛道的难点也很现实。推理芯片最大的问题从来不是设计,而是生态绑定。CUDA体系已经把开发者、调度工具、优化路径全部锁在一个体系里。要切进去,必须同时解决编译器、框架适配、以及客户迁移成本,这些环节远比芯片本身复杂。
Jane Street这类机构的持续加注,更像是在押一种结果:如果推理成本真的成为AI商业化的核心变量,那么算力效率会变成接近金融资产定价模型的东西。谁能更低成本生成token,谁就能在模型调用市场里获得结构性优势。
不过行业历史也有类似影子。ASIC曾经在比特币挖矿里成功替代GPU,但那是一个目标极度单一的系统。而推理场景要复杂得多,模型结构、上下文长度、调用方式都在变化,通用性和专用性之间始终在拉扯。
Etched现在还处在一个很早的位置:芯片回片、客户测试、机架验证同步推进。真正的分界点不在融资,也不在合同金额,而在第一批真实流量跑进来之后,能不能在成本曲线和稳定性上形成不可逆优势。AI硬件行业很多故事都在这一刻分叉。