身份不明的发言人
Sanjay Gajendra(总裁、首席运营官、联合创始人兼董事)
Nick Aberle(副总裁、财务主管兼投资者关系负责人)
身份不明的参会者
Ross Seymore(德意志银行)
Sam Sa. 好的。大家下午好。我们开始下一场炉边谈话。非常高兴邀请到 Astera Labs 的两位高管。Sanjay Gajendra。抱歉,各位。总之,Sanjay 是公司的首席运营官和联合创始人,还有 Nick Aberly,他是财务副总裁,负责投资者关系。先生们,非常感谢你们的参与。你们一直是 AI 连接领域的纯玩家,相对较新的 IPO。对你们来说,这是激动人心的一年半。你们的股价在这段时间内上涨了近 5 倍。对此表示祝贺。考虑到你们在客户基础等方面涉及的连接协议,我认为你们非常适合观察 AI 领域的发展。
我想从一个高层次的问题开始,简单地说,你们认为我们处于 AI 周期的哪个阶段?你们是否看到支出在变化、加速、减速或多样化?你们认为我们处于什么阶段?是的。
让我来开始回答。首先,感谢邀请我们来到这里。很高兴能在这里与你们和其他人交流。回到你的问题,我们仍然从根本上相信我们处于 AI 的早期阶段。我认为这是基于我们看到的 RFQ 和机会的数量。短期内不会放缓。事实上,它只会越来越大。推动这一点的当然是超大规模企业。他们的支出持续增长。在这方面绝对没有放缓。
我们看到的第二件事是,对内部或定制加速器的投资增加了。主要是因为我认为公司现在明白了 AI 的价值所在,以及从总拥有成本(TCO)的角度来看,他们需要优化的工作负载需求。所以有了这种认识。这并不意味着他们不需要来自 Nvidia、AMD 和其他供应商的通用 GPU,只是意味着他们也理解了需要什么。因此,在这些决策上,人们会有更多的思考和优化。
总的来说,我认为拥有一个强大的供应链和多供应商方法来应对各个方面,无论是在 GPU 方面还是在连接方面,绝对是我们看到的一个变化。我们的愿景是,从现在起三到五年内,拥有一个开放、可扩展且具有多供应商供应链的 AI 机架将成为关键要求,因为 AI 将继续广泛部署,无论是在训练工作负载还是在推理方面。
既然你们没有看到支出放缓,反而看到了一些加速,你们是否看到了任何变化?处理器数量和集群规模是否继续增加?如果是这样,我们如何看待你们的连接内容与之同步增长?
绝对没有放缓。从 Hopper 一代的 8 GPU 集群到现在 72 个。对于 Ruben 和其他人来说,如果以此为基准,你可以看到它迅速扩展到 288 甚至更多。因此,我认为它不会放缓,因为模型复杂性和模型规模在持续增长。在连接方面,这是一个绝佳的位置,因为最终 GPU 或加速器做它们该做的事情,但随着集群规模的扩大,数据移动量会大幅增加。
因为正如你可能知道的,在 GPU 集群中,每个 GPU 都需要与其他 GPU 通信。这意味着即使是一个 72 GPU 的集群,从软件的角度来看,它也需要表现为一个共享相同内存的 GPU。实现这一点的方法是创建一个超快、超可靠的连接结构,并确保从软件的角度来看,事情以一种一致性和类似的方式发生,使一切看起来像一个整体,而这种魔力是通过连接实现的。今天,连接确实是瓶颈。
这意味着有很多创新、很多产品和技术需要开发。因为正如你们中的一些人可能听说的,尽管人们为 Nvidia GPU 支付了数千美元,但大约有一半的时间它实际上是在等待数据或内存。这仅仅意味着需要解决的问题是连接。随着集群规模的扩大,这个问题不会变得更简单,只会变得更复杂。这就是我们在 Astera 看到的机会。
我暂时稍微转向一个更近期的动态。你们提到了 Nvidia 和一些关于向中国发货或不发货的事情。这对你们有影响吗?这是否是一个小小的逆风?如果处理器公司无法发货,商家无法发货,如果他们可以开始发货,这对你们来说是否会成为顺风?或者这只是边缘问题,并不真正重要。
我想再次强调,中国是一个重要的市场。我认为他们确实看到了很多数据,AI 工作负载等方面有很多势头。但由于地缘政治的阴影,这也是一组略有不同的动态。对我们来说,是的,我们确实从中国获得了一些个位数的收入,但与此同时,我们并没有依赖它,以至于我们的战略和我们制定的模型都偏向它,因为你永远不知道会发生什么。
所以对我们来说,我想说的是,如果发生了一些好事,比如地缘政治方面的事情开放了,我们总是会将其视为一个上行空间,而不是在我们的基础模型中计划它。这就是我们一直以来的做法。让我们看看事情如何发展。好消息是,至少到目前为止,与处理器和相关技术相比,连接并没有受到那么多的关注。
它是次要的,但仍然很重要。所以我想谈谈一些多样化动态,我们会稍微谈谈客户、处理器和市场方面的事情。首先,在超大规模企业方面,我认为去年你们从 3 个 10% 或更多的客户增加到现在的 5 或 6 个。是什么导致了这种多样化?
导致这种多样化的真正原因是市场内部的动态。云和超大规模企业客户,真正重要的客户数量是有限的。所以当客户增加时,你可以立即从出货量中看到这一点。这是一点。第二点是,对新技术的胃口在超大规模企业之间有所不同。有些超大规模企业总是渴望新技术。一旦技术可用,他们就想在他们的舰队中部署。这就是你所看到的。我的意思是,你们有一些客户,主要是 Nvidia 和 AWS 等公司,他们是第一批部署新技术的人。
所以有一个时间因素,随着时间的推移,你会看到更多的人加入,从第一批到下一批人之间总是有 12 到 24 个月的差异。我想说的第三个因素是商业模式。如果你想想像 Meta 这样的超大规模企业,他们主要运行内部工作负载,如 Instagram、WhatsApp、Facebook 等。与像亚马逊或微软的 Azure 相比,他们运行的是传统的云服务,即租赁模式。他们不知道谁会需要什么,无论是 Nvidia 实例还是 AMD 实例等等。
所以我想说的是,根据客户数量、有限的市场、对技术的胃口以及超大规模企业推动的商业模式,这些因素会影响我们的市场份额变化。在某种程度上,这是职业风险。如果你想想超大规模企业的数据中心市场。
市场,是的,它天生就是集中的,无论你做什么,如果你没有赢,你就不会在这里。你们认为大多数关键设计胜利是在超大规模企业方面还是在各种处理器制造商的参考设计中?
我想说这是一个组合,但越来越多的是,由于许多超大规模企业正在开发自己的加速器,对我们来说,这是一个机会,在非 Nvidia 生态系统中,我们可以在前端网络和后端网络中发挥作用。一般来说,考虑到我们现在专注于 Scorpio X 系列,这是一个用于互连 GPU 等的结构设备,我们与超大规模企业有很多直接的合作和互动。
当你想到参考设计时,无论是在 GPU 平台还是 CPU 平台上,这绝对是一个渠道和途径。但与此同时,我想说的是,合作必须与超大规模企业进行,这样我们才能推动其他决策。然后你还有像 Nvidia 和 AMD 这样的主要商业硅供应商,他们一直是我们的伟大合作伙伴,我们继续在他们的平台上发挥作用。
在处理器方面,去年年底和今年早些时候,你们谈了很多关于多样化进入定制架构的事情,不是远离商业方面,而是在商业方面之外。你们如何看待定制方面与商业方面未来的机会?这是你们业务内部的两者之间的重大斗争,还是它们可以。
两者都可以增长。我想简短的回答是两者都可以增长,因为每个人都有空间。像 Nvidia 这样的公司所做的 GPU 类别完全不同。这些是可以用于运行各种不同工作负载的通用 GPU。而你有定制的加速器,它们被设计用来解决一类独特的产品。我不认为任何定制加速器是为了与 Nvidia 正面竞争而设计的。所以根据工作负载的类型和超大规模企业推动的商业模式,你会有空间。
就像我之前提到的,从附加率的角度来看,我们喜欢非 Nvidia 生态系统,因为我们可以在前端和后端发挥作用,对吧?所以我们看到了更大的内容。如果你想想我们的增长本身,我们一直在朝着我们制定的五步战略努力。从 IPO 时间框架来看,我们增长的第一步是基于 Nvidia Hopper 一代,我们在他们出货的所有 UBB 和 HGX 平台上都有产品,对吧。
去年第三季度,我们转向了客户加速器。从去年第三季度开始,我们的收入上升了一个台阶。现在我们进入了我们旅程的第三步,从第二季度开始,我们不仅销售 Retimer 类设备,我们还为 Blackwell 平台销售交换机设备。所以我们的美元内容从每个加速器不到 100 美元上升到现在的每个加速器几百美元。从设计胜利的附加率来看,我们正在努力的第四步是进一步多样化我们的产品组合,我们称之为 Scorpio X 系列。
所以这些是用于 GPU 到 GPU 互连的结构设备。我提到的 Scorpio P 系列作为第三步,是用于 GPU、CPU 等的头节点连接。所以 X 系列从插座的角度将我们置于一个完全不同的位置,因为规模扩展交换机是超大规模企业做出的早期决策因素之一。所以我们有几个设计胜利,设计胜利将在今年晚些时候开始进入大规模生产。在 26 年,我们有超过 10 个客户在规模扩展结构方面与我们合作。
当然,我们的第五步是我们推动的愿景,即基于 UA Link 的完整机架级连接解决方案,这是一个为开放标准格式的规模扩展网络定义和开发的标准,将在 2027 年投入生产。所以如果你想想我们的故事,它是一个我们不断增加更多产品线以服务相同应用程序的故事,这些产品是从头开始设计的,用于服务 AI 工作负载。然后我们正在扩大我们合作的客户基础,从传统的超大规模企业类型客户到其他二级、三级玩家,他们基本上开始基于新的云模型等部署大型云。
总之,我认为我们准备得很好。这只是确保我们继续执行的问题,有很多方法。
我可以接受这个答案,但我会选择 ASIC 方面来结束这个问题,然后我们可以谈谈 UA Link 和其他一些协议。ASIC 供应商的数量是否在继续增长,可能成为你们的潜在客户?我知道这不是与商业方面的零和游戏,但这个机会本身似乎在多样化和快速增长。这是真的吗?
绝对是的。就像我说的,我认为超大规模企业已经意识到,他们明白了 AI 工作流的价值所在,他们希望构建加速器来解决和优化这个问题。第二点是没有人希望被限制在他们如何开展业务的方式上。我的意思是,今天如果你想想,他们有几种方式在某种程度上被束缚,对吧?有 Nvidia 追求的垂直整合,然后有像 Broadcom 这样的公司试图提供一种结合了他们的定制 ASIC 和网络等的解决方案。
我们真正相信有第三种方式来实现这一点,那就是提供一个开放机架开放标准,服务于各种不同用例的细微差别。这就是我们现在看到的势头所在,也是我们关注的焦点。
你们是否认为 ASIC 供应商,恰好也有大型网络部门在他们的公司中,比如 Broadcom、Marvell 等两家公司。他们是否有一个捆绑优势?对你们来说是否更具挑战性,因为他们有与你们竞争的网络部门?
很容易这样想象。但如果你想想,有几个例子你可以想到,比如 Google,他们为 TPU 使用定制 ASIC 服务,但他们自己做网络等。所以我认为这可能是一种稍微简化的思维方式,想象你可以以某种方式捆绑这两件事,因为再次,你在定制加速器上需要的,它的要求,它的功能集,即使它可能在后台由某人制造,但它的设计是由超大规模企业完成的。
超大规模企业也不想被某些解决方案束缚。所以发生的事情是它产生了相反的效果,我们被更多地邀请参加这些聚会,这样他们可以从两个世界中获得最好的。我的意思是,我们正在开发真正差异化、真正为 AI 工作负载开发的技术。然后与超大规模企业设计的加速器结合,他们能够获得技术性能或优势,商业上和合同上,以及定价和其他杠杆,他们也能够获得这些。
所以总的来说,超大规模企业并不愚蠢。他们不想被束缚,他们以一种你期望的方式做出反应,那就是试图从技术世界和商业角度获得最好的。
我们为什么不转向一些产品线,然后围绕这些话题。让我们从 Scorpio 开始。我知道这不是你们最大的产品线,但它现在增长非常迅速。它与你们谈到的规模扩展动态有关。我们为什么不从规模扩展方面开始?谈谈各种协议。你们是 UA Link 的大力支持者。显然你们有 NVLink,然后 Broadcom 正在用 sue 方面做自己的事情。谈谈 UA Link 的优势以及为什么你们认为这是正确的方式。
在我谈论 UA Link 之前,让我们看看现在的情况。规模扩展网络是一个全新的用例。Nvidia 有 NVLink,现在有了 NVL72,你开始看到 NV 交换机。在过去,如果你回到 Hopper 一代等,有 8 个 GPU,你不需要交换机,除非你试图构建某种更大的集群。但一般来说,如果你向前看,大多数部署将需要 GPU 以更大的数量集群,因此需要交换机。
今天有 NVLink,它是专有的,大多数客户使用 PCIe 或类似 PCIe 的标准来互连他们的加速器或 GPU。当然,也有一些使用以太网。例如,Intel Gaudi Havana 芯片使用以太网作为扩展器。但与使用 PCIe 或类似 PCIe 的相比,这是一个小数目。为什么人们使用 PCIe?因为它是一个非常轻量级的协议。有多年为其构建的软件,然后从生态系统的角度来看,比如 IP、测试设备、电缆连接器等,它相对容易。
所以我想说的是,生态系统存在,它是一个开放标准。现在向前看,如果你想想为什么有人不想继续使用 PCIe?这归结为一个简单的挑战,GPU 试图以非常高的速度相互通信,表现为一个巨大的 GPU。PCIe 在 Gen 6 上仍然是 64 千兆。是的,Gen 7 将达到 128 千兆,但 NVLink 已经在 200 千兆。所以行业面临的挑战是如何获得一个轻量级、适合规模扩展拓扑的开放标准,同时可以运行得更快。
这就是 UA Link 发挥作用的地方。UA Link,尽管是一个新标准,但从根本上来说并不是一个新标准。他们做了一些我们认为非常聪明的事情,那就是采用 PCIe 传输层和以太网的物理层,后者已经在 200 千兆,对吧?并将这两者结合起来。所以你获得了 PCIe 的简单性和以太网标准提供的速度,这就是 UVlink。所以联盟在去年 10 月成立。
到 3 月 4 月,第一个版本的 SPEC 已经发布。所以开发这个规范用了不到六个月的时间,因为它并不是试图从头开始做所有事情。人们熟悉 PCIe 或类似 PCIe 的软件接口,你可以想象软件是部署任何新标准时非常重要的考虑因素。所以我们喜欢这种方法,因为它从技术角度解决了需要解决的问题。内存语义都是原生支持的。软件支持更加无缝。然后你获得了从 200 千兆或 400 千兆等规范中需要的速度。最重要的是,它是一个开放标准。
有多个 IP 供应商,多个测试设备供应商,电缆连接器供应商和产品供应商。所以最终,如果你想想连接标准的历史,是开放标准胜出。我的意思是回顾 USB、PCI Express、以太网等。这就是为什么我们支持它,几个其他超大规模企业和 GPU 供应商也在加入。现在与 sue suv 比较,正在推广的规模扩展以太网,你必须这样看,对吧?首先,它不是你的标准以太网。
我认为在某种程度上,有聪明的营销将“以太网”这个词附加到它上面,让它听起来像是开放的。但历史是,如果你想想以太网设计时,它是为了在多个数据中心和全球范围内传输数据而设计的,对吧?以太网的名字是鲁棒性。当你做规模扩展时,它太多了,有太多的开销,有太多的延迟。还有其他因素在起作用,至少在这个特定情况下,当然 Broadcom 理解这一点,他们说让我们尝试用更小的帧大小、数据包大小和内存语义等重新定义标准。
他们把它带到了 uec,即超以太网联盟,他们很快意识到它不再是原生以太网或标准以太网了。它是一种专有方式,他们没有接受它。然后它当然作为一个独立的标准发布。所以我想说的是,它在所有实际用途上都是专有的。供应商有限,现在只有一个。所以它并没有真正改变超大规模企业试图解决的问题,那就是如何从 NVLink 和 Nvidia 的锁定中解脱出来,获得更广泛可用的东西。
所以长答案,但这就是我们看到的动态。我想 2027 年当 UA Link 推出时,你会看到为什么这对 Astera 和行业来说是有意义的。你还会看到越来越多的超大规模企业公开出来谈论 UA Link 如何成为他们 GPU 到 GPU 互连的路线图。
完美。长答案,但好答案。理解这些协议很重要。所以如果我们回到 Astera 层面。想想 Scorpio。它从去年的基本零收入到今年我认为低两位数的销售百分比,至少在我的估计中,明年将再次翻倍以上。谈谈我们迄今为止在 P 系列中看到的增长,以及 X 何时启动,也许只是相对于公司最初建立的 retimer 来说,内容的增加。
是的。就像提到的,我们处于第三步,我们正在出货 P 系列,用于头节点连接的 PCI 交换机,我们从第二季度开始为 Blackwell 平台出货。Scorpio X 系列是我们非常兴奋的。它将完全改变公司,因为无论是从业务角度还是从这些是锚定插座的角度来看。我的意思是,如果你是超大规模企业的系统工程师,你在开始新设计的前五分钟会关心两个设备。一个是 GPU,另一个是规模扩展交换机,然后其他一切都围绕它构建。
对我们来说,Corpio X 系列实现了这一点,我们从第一次会议开始就参与讨论,我们现在正在进行这些讨论,我们不仅关注当前一代,还关注未来两三代与我们的超大规模企业客户。所以它将是一个重要的设备或产品类别,为我们提供附加率和美元内容的锚定。就像我提到的,三个计时器我们在一个给定的设计胜利上每个加速器不到 100 美元。
现在我们升级到每个加速器几百美元与 P 系列交换机。对于 X 系列交换机,我们预计这将转变为每个加速器几千美元。所以如果你只考虑附加内容和我们将看到的美元,路径将是相当重要的。这是一个大市场,所以我们对可能发生的事情感到非常兴奋。
关于 X 的时间安排,这是否会受到 UA Link 的限制,或者是否有理由你们可以提前启动?
我们会提前启动。所以再次记住,今天 UA Link 仍然是 2027 年的故事,但规模扩展现在正在发生,并且是在像 PCI Express 这样的协议上发生的。我不想说它是原生 PCI Express。有一些扩展正在做,我想就像我们沟通的那样,我们预计初步增长将在今年年底发生,全面增长我们预计在 2026 年跨多个平台。2027 年我们升级到 UA Link,现在从多个客户和多个用例开始,这为我们打开了额外的机会。
明白了。好了,在剩下的五六分钟里,我们会进行一些更快速的问答。对我来说,至少进入规模扩展方面和 Scorpio 方面非常重要。所以这些问题会更直接。Aries,你们的 retimer 业务,你们认为这个业务的可持续增长率是多少?
速度在增加,这意味着你会遇到物理挑战,你需要通过放置 retimer 来解决这些问题。所以这些设备是信号放大器。它们扩展了零售信号。所以只要速度在增加,你就总是有机会使用 retimer,这将持续增长。这里的微妙之处在于,因为它试图解决物理问题,有时你需要一个,有时你需要两个,有时你根本不需要。例如 Hopper 一代,基板上有 8 个 GPU。
所以板子很大,对吧?你到处看到 retimer。对于 GB200 GP300,只有两个 GPU,板子变小了。猜猜看?可达性问题不那么明显。所以你不需要在 Nvidia GB200 板上使用 Retimer,你需要在系统的其他地方使用它。所以 retimer 业务的诀窍是它并不总是一样的。但从根本上说,只要速度在增长,你可以预期 retimer 插座和用例将继续增长。
你们如何看待 Astera 从 Gen 5、Gen 6 等的市场份额?因为你们迄今为止一直占据主导地位。
我想说我们相信它将保持不变并继续扩大,因为如果你想想,我们是唯一的人。我的意思是每个人都担心 Gen 6 会发生什么,也许宣布了一个产品,我们进入了生产,还有几个其他人宣布了。但据我们所知,我们没有看到任何人进入生产或有设计胜利活动。因为关键要记住的是,这不仅仅是关于芯片,而是关于我们为使它工作而建立的所有部落知识。
更重要的是,我们有这个 Cosmos 软件,它提供了某种舰队管理等能力。这是可跨代移植的。所以这为我们提供了粘性,以确保我们继续保留我们拥有的插座。
Cosmos 是否在所有产品线中都有益,而不仅仅是在 Ares 中?
绝对是的。Cosmos 是如此重要的一部分,因为相同的 Cosmos API 适用于我们所有的产品系列。所以如果客户使用我们的 SDK 或 API 进行通信,他们可以将其用于 Taurus,可以用于 Scorpio。当然,他们会获得额外的功能,因为每个设备都带来了更多的东西。但一旦他们设计了基础设施,就只是跨代和跨产品线重复使用的问题。
Taurus 方面的类似问题,AEC 市场,这个市场的可持续增长率是多少?你们看到的内容轨迹是什么?
是的,对于 AEC 市场,就像我们一直说的,这是一个个案情况。不是每个客户都使用 aec。你不能因为客户 A 使用它就说客户 B 可能会决定使用光缆或无源电缆等。所以对于 400 千兆,行业中有几个大的插座可用。这是我们关注的焦点 800 它变得更加广泛。这就是我们现在正在扩展的地方。大多数增长发生在 2026 年的 800 千兆以太网。所以我们将继续在那里扩展。
我想强调的微妙之处是,我们在那个领域与 CREDO 竞争。他们做整个电缆,我们做电缆内部的桨卡,使传统电缆供应商 Molex、Te、Amphenol 等能够使用。所以我们的商业模式是这样的,我们为规模做准备。随着量的增加,你需要容量和多供应商供应链,我们去攻击那里。所以我们不会在前六个月,但一旦量开始增加,我们就会开始获得份额并以稍微不同的方式解决那个特定的插座。
仅仅因为我们不相信携带库存和电缆类产品带来的所有麻烦,这不是我们的专长。我们的专长是开发硅和软件等。所以我们试图忠于我们的优势,而不是试图成为电缆的制造工厂。我们会把它留给专家。
所以在剩下的一分半钟里,我想有两个最后的问题。我会一次问两个。这样你们可以分配任何剩余的时间。所以 Leo CXL 方面似乎比大多数人预期的要慢。更多的是协议问题。不是你们的错。你们认为什么时候会启动。最后一个问题是,当 Scorpio 推出时,人们非常兴奋。那个结构交换机方面打开了 50 亿美元的市场。你们在运营支出上投入了很多。你们招聘非常迅速。我们是否应该期待在这些之外看到额外的产品线,如果我记得正确的话,被引入?
是的,我认为 LEO 的问题很简单。就像你说的,我们有设计胜利。这是一个由于几个超出我们控制的原因而启动的问题。但最重要的是 LEO 用于 CPU 连接。这不是一个 GPU 故事。你知道,现在每个人都想谈论 GPU 和 AI。这是钱所在的地方。但我们确实预计 Leo 最终将在 2026 年启动。但时间框架,所以这不是一个失败的事业。这只是时间问题。就我们的产品而言,显然,你知道,我们与超大规模企业和 AI 平台供应商有前排座位。
所以我们一直在开发几个新产品。你知道,我们谈论四个,但你可以放心,我们正在开发的还有很多很多。但我们不相信在它进入生产之前谈论它。所以我会说等着看。它会来的,而且会以一种非常重要的方式到来。我想对我们来说,愿景是交付整个 AI 机架,除了计算节点。这就是我们正在努力的方向,我们将继续追求这一点。
完美。好了,我们正好准时。所以,Sanjay 和 Nick,非常感谢你们上台与我们交流。
太好了。非常感谢你们。