广船国际技术(GSIT)2026财年公司会议

声明:以下内容由机器翻译生成,仅供参考,不构成投资建议。

企业参会人员:

Didier Lasserre(销售与投资者关系副总裁)

分析师:

Quinn Bolton(Needham & Company)

发言人:Quinn Bolton

各位早上好。感谢大家参加Needham第28届年度增长会议。我是Quinn Bolton,Needham & Company的半导体分析师。非常荣幸主持本次来自GSI Technology的演讲,该公司总部位于我的家乡加利福尼亚州桑尼维尔。GSI凭借其突破性的APU技术处于AI革命的前沿,该技术专为十亿级项目数据库搜索和高性能计算中的无与伦比的效率而设计。GSI的创新产品Gemini 1和Gemini 2提供可扩展、低功耗、高容量的计算解决方案,重新定义了边缘计算能力。GSI还是SRAM技术的领导者,并为太空和军事应用开发抗辐射存储器解决方案。

今天上午,公司的Didier Lesserre(销售副总裁)和Kim Rogers(外部投资者关系)将与我一同出席。在我将发言权交给Didier进行演讲之前,我想提醒观看网络直播的投资者,如果您想在问答环节提问,请通过屏幕底部的对话框提交。Didier,请开始。

发言人:Didier Lasserre

谢谢,Quinn。正如Quinn刚才所提到的,我是Didier Lesserre,全球销售与投资者关系副总裁。感谢大家今天上午参加我们的演讲。我会尽快完成演讲,以便留出一些时间进行问答。我们将发表一些前瞻性陈述。因此,我们当然会在此包含安全港声明。关于GSI的一些背景信息:公司30年前在硅谷成立,正如Quinn所说,位于加利福尼亚州桑尼维尔。我们于2007年上市。我们实际上没有自己的晶圆厂。

我们使用台积电,并且从成立之初就与台积电建立了合作关系,关系非常稳固。我们在他们的某个工艺节点上一直是技术领导者,这些年来一直与他们紧密合作。正如Quinn所提到的,我们最初是一家SRAM公司。我会详细谈谈这一点。我们拥有业内密度最高、性能最强的产品线。大约10年前,我们收购了一些AI技术。这个系列的名称是APU,即关联处理单元。

我将在本次演讲的大部分时间里谈论这个话题。因此,SRAM部门实际上为APU的研发提供了资金。到目前为止,我们在Gemini 1和Gemini 2的研发和投产上花费了约1.75亿美元,这些资金都来自我们的SRAM业务。10月份,我们净筹集了4700万美元,以帮助推动Gemini 2和我们新的路线图设备Plato(我将谈论该设备)的发展。上一财年(截至3月31日,而非4月)的收入略超过2000万美元。

本财年,我们的全球增长率预计约为20%。员工人数为122人,其中大部分是工程师。因此,我们将高员工数量的职能外包,例如晶圆厂,正如我所提到的,我们使用台积电。我们还将组装业务外包。因此,我们能够将员工人数保持在非常低的水平。我们的APU拥有独特的技术,我们希望确保保护这项技术。因此,我们积极提交专利申请,公司共有144项专利,其中85项专门针对APU,我们将继续提交更多申请以确保这项技术得到保护。

截至9月底,我们拥有2500万美元的现金及现金等价物,正如我所提到的,这并不包括上一季度之后筹集的4700万美元。市值约为2.7亿美元,内部人士持股比例相当高,为21%。简要介绍一下我们的主力产品线——SRAM,正如我所提到的,我们拥有市场上密度最高、性能最强的存储器。我们的大部分收入来自Sigma Quad系列。Sigma Quad有第二代产品,在某些系列上存在竞争。

我们还有第三代和第四代产品,这些产品没有竞争,我们是独家供应商。过去几年,我们看到许多新的设计订单来自第三代和第四代产品。因此,我们未来的大部分业务实际上没有竞争。这反映在多年来我们的平均售价(ASP)和毛利率都有所增长,因为我们是独家供应商。我们利用这个系列扩展到了一个新的产品线,正如Quinn所提到的,即抗辐射(RAD Hard)或耐辐射SRAM。

这将为我们打开进入太空的新市场。谈到这些市场,本质上我们所做的是将我们的商用产品线进行加固,以能够承受太空中的一些恶劣条件,例如来自太阳和其他区域的辐射。因此,这使我们能够进入以前商用产品无法进入的航空航天应用领域。这是一个不错的市场,因为其平均售价和毛利率都非常高。迄今为止,我们销售的产品平均售价在10,000美元到30,000美元之间。

毛利率都超过90%。这是一个难以进入的市场,进入的设计周期很长,但一旦设计被采用,这就是一个非常容易的市场。生命周期非常长,而且没有竞争。另一个优势是,这是一个不断增长的市场,正如你所看到的。几年前,这是一个20亿美元的市场,到2032年,预计将增长一倍以上,达到近50亿美元的市场规模。因此,本次演讲的其余部分我将重点介绍APU。

APU是一款AI芯片,我们专注于边缘计算。稍后我们将讨论为什么这是我们的战略。如果你看边缘半导体市场,它正呈现出巨大的增长。今年,我们预计市场规模略低于70亿美元,而五年后将超过160亿美元。我们拥有非常独特的技术,正如我在谈论专利时所提到的。我们拥有真正的存内计算架构,我强调“真正”是因为有些公司虽然也谈论存内计算,但并非真正的存内计算。

他们拥有的是所谓的近存计算,即实际上将存储器靠近计算元件,但它们仍然是分离的。我们将讨论为什么做出这种区分很重要。另一个优势是,我们的设备(Gemini 1和Gemini 2系列)上有数百万个位处理器。这很重要,因为它使我们能够进行大规模并行处理。我们能够使用这些百万位处理器同时工作。如你所知,在AI市场中,并行处理是关键。如果你看CPU,它们有几十个计算核心。

如果你看GPU,它们有数千个(约2000个)ALU核心。而正如我所提到的,我们有一百万个。因此,我们可以将并行处理发挥到极致。这张幻灯片展示了APU与GPU的架构有多么不同。左侧是APU,可以看到位处理器或计算元件直接与存储器相连,它们实际上是一体的;右侧是典型的GPU结构。数据存储在DRAM存储器中。

为了让计算元件进行处理,它需要获取数据,在GPU中,数据必须通过L2缓存,然后通过L1缓存和寄存器才能到达计算元件。显然,这需要时间和功耗。请注意箭头是双向的,因为一旦计算元件获取了数据,它需要将数据写回存储器。因此,现在必须通过相同的结构返回,经过不同的缓存回到存储器。

显然,这需要时间和功耗。现在,我们的位处理器还有另一个优势,即我们的分辨率或位宽不是预先确定的。如果你看GPU,它的内部元件基本上是预先布线的,使其要么是32位、16位或8位分辨率,你只能使用这些。我们是位引擎,不关心你如何构建它。你可以使用1位、10位,或者1到100万之间的任何数字,这就是你可以实现的分辨率。

这一点很重要。哦,顺便说一下,分辨率可以逐周期变化。例如,你决定使用8位模型,下一个周期可以改为6位或16位。因此,它不是固定的。这很重要,因为研究人员在尝试优化模型时发现,不同的位宽是最优的,其中一些不适合GPU。例如,假设是12位,那么你将使用16位GPU,使用12位,然后基本上浪费4位。

因此,这是低效的。而对于我们,你可以精确地构建你想要的分辨率。还有许多新的用例,如量化,试图使用更低的位分辨率来处理这些庞大的大型语言模型。数据库变得非常大,他们发现1位、2位或3位分辨率很重要。同样,我们现在就能做到这一点。我们不必等待未来的设备来实现该分辨率,我们现在就拥有这项能力。正如我们所提到的,目前我们有两个系列产品。

第一个系列Gemini 1实际上是为了展示我们的独特技术而设计的。不过,我们已经为一些应用开发了一些模型,包括SAR(合成孔径雷达)应用。如果你观看CNN,可能会看到有关乌克兰局势的报道并显示图像,很可能他们展示的图像是使用SAR设备创建的。我们已经做到了这一点。Gemini 1的市场实际上需要基于地面,因为我们必须将其连接到带有FPGA的板上。

因此,Gemini 1实际上是用于展示技术的。几个月前,康奈尔大学发表了一篇论文,将我们的APU与英伟达的GPU进行了比较。他们使用的是第一代产品Gemini 1进行RAG应用,结果表明我们的架构比英伟达的GPU功耗低98%。我将更多地关注Gemini 2。Gemini 2的独特之处在于,与Gemini 1不同,它不依赖于板卡。因此,如果我们愿意,可以将其作为芯片出售。

它也可以安装在板上或服务器中的多个板上。但现在它可以以芯片形式存在,这使我们能够更接近边缘。我们正在追逐的一些早期市场,这与我们在军事国防领域取得的一些成功有很大关系,即军用无人机和无人驾驶飞行器(UAV)。这款设备有很多不同的应用。正如我所提到的,我们可以进行SAR图像创建,也可以进行目标检测。由于这两个特性,它使我们能够在GPS拒止环境中实现自主无人机。

再次,如果GPS被干扰,你可以使用我们的设备创建你正在飞越区域的图像,然后通过目标检测识别你的位置并使用这两个特性进行导航。我们昨天宣布与G2Tech公司建立合作伙伴关系,同时与美国国防部(前称Dow)合作开展无人机应用的概念验证(POC)。实际上,这不仅仅是无人机应用,它实际上是一个多模态VLM模型,同时使用摄像头和无人机。因此,该POC使用Gemini 2进行,我将详细介绍这一点。

由于我们的设备功耗极低,这使得许多此类无人机的任务时间得以延长。我们的下一代产品是Plato。如果你看Gemini 1和Gemini 2,它们非常适合向量搜索。我们的架构设计是内部带宽非常高,而通往存储器的带宽较低。我们这样做的原因是我们通常会将模型集成在我们的设备上。现在,为了处理大型语言模型(LLM),如果你熟悉它们,你会知道数据库规模非常庞大,无法集成在一个设备上。

因此,必须访问外部存储器。因此,我们所做的是大幅提高通往外部存储器的带宽。因此,Plato将真正用于处理LLM,但不是数据中心中的LLM,而是边缘的LLM。我们将讨论为什么这很重要。正如我们所提到的,我们专注于边缘。许多应用正在从云端过渡到边缘。我们看到的是,显然他们需要将工作负载移至更接近发生地的位置。我们还发现,云计算成本变得昂贵,特别是对于一些较大的模型,在云端来回传输变得昂贵。

此外,还有许多应用,特别是军事和国防领域,任务不允许离开本地设备。他们不希望数据通过云端传输,因此必须保持在本地。此外,许多应用需要实时决策或识别,没有时间通过云端传输。因此,我们发现这些边缘应用确实需要每瓦计算效率非常低的架构。这正是我们的APU所提供的。如果你看我们正在解决的问题,正如我所提到的,我们确实专注于边缘,早期特别关注军事国防领域,因为我们认为这是低垂的果实。

但如果你看我们目前的路线图,我们现在拥有Gemini 2,硬件已经准备就绪,是我们的量产硬件。我们仍在软件开发方面进行一些工作,这也是我们筹集4700万美元的原因之一,正如我提到的Plato。Plato的流片将在2027年初完成,大约一年后。我们预计,最好的情况下是2027年底,但实际上量产将在2028年开始。

我们已经有合作伙伴在讨论下一代设备,他们非常希望采用更先进的工艺节点架构。我提到的我们一直关注的领域之一是军事国防,因为我们在这些市场有很多进展。我们已经获得了340万美元的SBIR(小企业创新研究计划)资助,这可以视为政府拨款。这还不包括我们昨天宣布的POC。我将单独谈论这一点。但我们在太空发展局获得了第二阶段胜利,在空军获得了第二阶段胜利,去年在美国陆军获得了第一阶段胜利。

我们最近宣布,我们的一个第二阶段项目获得了延期,额外获得71.5万美元,用于对我们的Gemini 2进行波束测试,看看我们的商用设备在没有任何增强的情况下表现如何。具体回到与G2Tech的POC,正如我们所提到的,这是与美国国防部和另一个希望保持匿名的外国国防机构合作的。

因此,我们将获得略超过100万美元的POC资金。我们目前正在优化上一张幻灯片中提到的TTFT(首次令牌时间),以便在今年夏天进行完整演示。至于未来的SBIR,我们已经提交了一些申请。我们已经提交了约600万至1000万美元的申请,正在等待答复。

我们还提交了一份名为“广泛机构公告”的提案。这些可以视为更高级别的SBIR,价值可能高达4000万美元。我们目前还在寻求开展STRAPFI计划,该计划基本上由私人方和政府机构提供资金,并由App Works匹配,我们谈论的资金数额在1000万至2000万美元之间。最后,在资金方面,我们一直在与一些主要承包商和国防承包商积极对话,以建立战略关系,这也将涉及一些研发资金。

因此,如果你看财务回顾,季度收入一直在增长,正如我所提到的,本财年我们的同比增长率预计约为20%。在此期间,我们的运营费用有所下降。正如我所提到的,截至9月底的现金及现金等价物为2500万美元,但这不包括10月份筹集的4700万美元净资金。因此,在演讲的最后,正如我所提到的,我们确实专注于边缘,这既是因为我们看到市场对我们设备的浓厚兴趣,

也是因为我们独特的低功耗架构使我们能够在这里取得成功。而且,正如我们所提到的,我们看到了向边缘的真正转变。我知道很多人专注于数据中心,但未来边缘将是大量业务所在。正如我所提到的,我们在国防和航空航天领域取得了良好的进展,特别是通过SBIR和一些POC。有趣的是,当我们与一些客户和合作伙伴讨论时,你知道,有英伟达、AMD,然后在AI领域有很大的差距。

大多数其他公司都是AI初创企业,初创AI公司面临的一个担忧是能否实现量产,特别是对于无人机等产品,量产至关重要。人们逐渐认识到,GSI在AI方面可能是初创企业,但在半导体制造方面并非初创企业。在我们的历史中,我们已经制造并出货了超过1亿个SRAM。因此,我们用于SRAM的制造模式也将用于APU。

同样的晶圆厂(台积电),同样的组装厂。我们将像测试SRAM一样进行自己的测试。因此,我们拥有经过验证的量产制造模式。正如我所提到的,几个月前我们净筹集了4700万美元,我们正使用这些资金来构建使Gemini 2成功所需的软件,同时也使用部分资金启动Plato项目。因此,Plato为了开始设计,我们需要购买一些IP,我们已经能够做到这一点。

因此,Plato设备或系列已经开始设计,正如我所提到的,我们将在2027年初完成设计。因此,我们将在2027年夏天看到首批硅片。Quinn,现在我们可以开始问答环节了。

发言人:Quinn Bolton

太好了。Didier,感谢你的演讲。我想先开始提问。我认为人们对推理的关注越来越多,诚然这可能更多是数据中心的推理。但如果看一些公司,比如英伟达刚刚收购了Grok。我想很多人会说,哦,他们在芯片上使用SRAM存储数据进行处理,因此更加节能。你谈到许多竞争对手使用SRAM进行近存计算,而你们使用SRAM进行存内计算。我希望你能进一步向收听网络直播的人澄清,因为我认为这是一个重要的区别,近存计算不是你们正在做的,你们在根本上做的是不同的事情。我想向收听的人强调这一点。

发言人:Didier Lasserre

好的。你实际上提到了两个要点,我想都谈一下。第一个是SRAM。正如你所说,他们专注于SRAM,因为SRAM在性能和功耗方面是最佳技术。正如我所提到的,30年来我们一直在设计市场上性能最高的SRAM,所以我们是SRAM专家。因此,这项技术与我们的历史非常契合。回到近存计算和存内计算的问题。

近存计算,以前存储器在这边,计算元件在那边,数据传输距离很远。这些公司所做的是将它们靠近,但它们仍然是分离的。因此,数据传输距离缩短了,但仍然存在冯·诺依曼瓶颈,仍然需要传输数据。而我们的架构,搜索或处理直接在存储器位线上进行。因此,数据位于计算发生的地方。因此,我们不需要去获取数据,它已经在那里了。一旦使用完毕,我们不需要将其写回存储器,它仍然在原地。

事实上,APU这个名称曾经更长。现在是关联处理单元,以前称为“原地关联处理单元”。因为数据在原地,不需要获取,也不需要重写。因此,根本区别在于数据位于处理元件所在的位置,我们不需要获取数据。

发言人:Quinn Bolton

非常好,谢谢你的澄清。然后,看看Gemini 1、Gemini 2和未来的Plato将在哪些应用中非常有效。你提到了向量搜索。哪些应用利用向量搜索?你能给投资者提供一些现实世界的例子,说明你们的技术如何应用于一些边缘AI应用中吗?

发言人:Didier Lasserre

是的。向量搜索用于许多应用。可以用于电子商务,例如你在亚马逊上进行搜索并获得匹配结果,这就是向量搜索。向量搜索还用于面部识别、目标检测,以及寻找新的药物分子。这些都属于向量搜索。

发言人:Quinn Bolton

那么内容或上下文处理也是向量搜索的应用吗?即试图在数据库中找到彼此相似的项目。

发言人:Didier Lasserre

绝对是的。这正是向量搜索的本质。当你说向量搜索时,它就是相似性搜索。事实上,这就是我们将第一代产品命名为Gemini 1和Gemini 2的原因。因为Gemini在神话中是双胞胎。所以这正是我们所做的,进行相似性搜索,寻找最接近的匹配。正是如此。

发言人:Quinn Bolton

好的,明白了。昨天宣布与G2Tech以及国防实体(美国国防部)的合作,再次向投资者强调一下,这个POC对于在实际应用中确立Gemini 2的能力有多重要?

发言人:Didier Lasserre

这是个很好的问题。让我们更仔细地看一下这个应用。首先,这是一个自主安全和响应系统。我的意思是,它结合了摄像头和无人机。你可以用摄像头设置 perimeter,但总会有盲点。例如,坏人可以躲在卡车后面或其他东西后面。因此,这就是为什么它还集成了无人机,可以四处飞行,消除盲点。

它可以自主工作。因此,即使系统出现故障,它仍然可以继续工作。本质上,它用于检测并识别是否存在威胁。以前这一直是由人力完成的,人们在监视器前检查一切。在这种情况下,不是“人在回路中”,而是“人在回路上”。我的意思是,不再是由人进行所有监控并判断是否存在威胁,而是由这个自主系统来完成。

它还有一个称为TTFT(首次令牌时间)的指标,基本上是你获取图像或文本的时间。值得注意的是,这是多模态的,我们可以处理计算机视觉或文本,这在目前是比较独特的,然后我们可以确定是否存在威胁。首次令牌时间是指你识别威胁的速度,然后你还需要能够快速反应。我们的Gemini 2的首次令牌时间优于GPU。

GPU的最佳情况是大约6秒获得首次响应,而我们是2.5秒,因此明显更快。因此,显然,如果一架无人机需要6秒识别问题,而另一架需要2.5秒,你知道哪一个会胜出。

发言人:Quinn Bolton

好的。你们正在进行概念验证,试图在今年夏天准备好系统演示。你提到正在将LLM移植到Gemini 2上,进行相关工作。在演示准备好之前,这是你们主要的工作吗?

发言人:Didier Lasserre

是的,这项工作实际上已经开始了。我们已经进行了几个月,大约6个月了。事实上,我们向合作的外国实体进行了初步演示。我们在10月初进行了初步演示,当时算法还远未优化,但当他们看到演示时,印象深刻。另一个有趣的方面是,最初这是为无人机市场设计的,但他们看了演示后说,这可以用于任何类型的车辆,而不仅仅是无人机。

因此,他们预计这可能会在更多用例中应用。

发言人:Quinn Bolton

对于在线的投资者,Gemini 2系统和你们提供给G2Tech或其他无人机的模型的美元含量是多少?一旦系统就绪,是否会引起其他无人机制造商或其他车辆制造商的兴趣,如你所说。因此,如果投入生产,每个系统中的美元含量是多少?

发言人:Didier Lasserre

这是个很好的问题。有两个方面。首先是硬件,在这种情况下,他们将从我们这里购买芯片,即Gemini 2芯片。我不会谈论平均售价,但大致来说,1000美元左右是一个合理的数字。然后是软件内容,他们需要许可我们正在开发的算法软件,无论是首次令牌时间算法、VLM算法、SAR算法还是特定无人机的其他算法。

因此,他们需要许可软件,并为此软件支付持续的订阅费用。

发言人:Quinn Bolton

明白了。有一位投资者提问:你们的SRAM芯片似乎比现有的近存SRAM更具优势。是的。GSI过去三年的收入仅在2100万至3000万美元之间。持续增加收入的障碍是什么?要实现盈利需要什么条件?盈利的时间安排?提问者是GSI故事的新关注者,不一定是半导体专家。

发言人:Didier Lasserre

这个问题包含了几个方面。在SRAM方面,SRAM市场并不是一个增长的市场。我不是说未来不会有应用推动分立SRAM市场增长,但目前市场是持平的。这解释了收入情况。至于增长,增长将来自APU,而APU目前正将这些POC转化为订单。其中一些是软件支持的问题,正如我所提到的,硬件方面我们状况良好,我们已经有量产就绪的Gemini 2芯片,但我们仍需在软件方面努力。

我们已经完成了许多不同的库和功能库,开发了如SAR等算法,正在开发TTFT和其他一些算法,但我们需要让大众能够自己开发算法。因此,我们需要开发编译器堆栈,让人们能够使用Python、PyTorch等高级语言开发自己的算法,并将其翻译成我们芯片能理解的语言。因此,软件方面的大部分工作将是继续编写更多这些功能库,同时将编译器堆栈提供给大众,让他们能够自己开发算法。

发言人:Quinn Bolton

作为对最后一个问题的跟进,听起来Gemini 2的这个POC可能是你们的主要推动力。假设今年夏天的概念验证和演示顺利,需要多长时间才能增加这个特定设计订单的产量?一旦你们现在花钱开发编译器和软件解决方案,假设年底完成,除了与G2Tech的这个POC之外,Gemini的其他设计订单的合理预期是什么?

发言人:Didier Lasserre

首先,要明确POC和编译器堆栈是分开的。对于POC,我们正在编写算法,将其优化,他们不需要做任何这方面的工作。正如你提到的,预计今年夏天完成最终演示。届时,他们将开始评估,可能会做一些修改,但可能在年底会有一些原型出货,假设一切顺利,量产将在2027年。

其他方面,正如我所提到的,我们与政府的一些SBIR项目,例如我们开发了YOLO 3、YOLO 5模型,还有其他一些领域。这些SBIR也为未来的设计订单奠定了基础。至于编译器堆栈,这更多是为其他想要自己开发的人准备的,而不是我们直接合作并为其编写算法的客户。这将是一个持续的过程,因为我提到这是一个堆栈,我们将随着时间推移发布不同的部分。因此,这是一个持续的项目。

发言人:Quinn Bolton

明白了。Didier,我们的会议时间结束了,感谢你参加Needham会议。非常感谢你的出席。

发言人:Didier Lasserre

谢谢。

发言人:Quinn Bolton

谢谢各位。GSI凭借其突破性的APU技术处于AI革命的前沿,该技术专为十亿级项目数据库搜索和高性能计算中的无与伦比的效率而设计。GSI的创新产品Gemini 1和Gemini 2提供可扩展、低功耗、高容量的计算解决方案,重新定义了边缘计算能力。GSI还是SRAM技术的领导者,并为太空和军事应用开发抗辐射存储器解决方案。今天上午,公司的Didier Laserre(销售副总裁)和Kim Rogers(外部投资者关系)将与我一同出席。在我将发言权交给Didier进行演讲之前,我想提醒观看网络直播的投资者,如果您想在问答环节提问,请通过屏幕底部的对话框提交。

Didier,请开始。

发言人:Didier Lasserre

谢谢,Quinn。正如Quinn刚才所提到的,我是Didier Laserre,全球销售与投资者关系副总裁。感谢大家今天上午参加我们的演讲。我会尽快完成演讲,以便留出一些时间进行问答。我们将发表一些前瞻性陈述,因此,我们当然会在此包含安全港声明。关于GSI的一些背景信息:公司30年前在硅谷成立,正如Quinn所说,位于加利福尼亚州桑尼维尔。我们于2007年上市。我们实际上没有自己的晶圆厂。

我们使用台积电,并且从成立之初就与台积电建立了合作关系,关系非常稳固。我们在他们的某个工艺节点上一直是技术领导者,这些年来一直与他们紧密合作。正如Quinn所提到的,我们最初是一家SRAM公司。我会详细谈谈这一点。我们拥有业内密度最高、性能最强的产品线。大约10年前,我们收购了一些AI技术。这个系列的名称是APU,即关联处理单元。

我将在本次演讲的大部分时间里谈论这个话题。因此,SRAM部门实际上为APU的研发提供了资金。到目前为止,我们在Gemini 1和Gemini 2的研发和投产上花费了约1.75亿美元,这些资金都来自我们的SRAM业务。10月份,我们净筹集了4700万美元,以帮助推动Gemini 2和我们新的路线图设备Plato(我将谈论该设备)的发展。上一财年(截至3月31日,而非4月)的收入略超过2000万美元。

本财年,我们的全球增长率预计约为20%。员工人数为122人,其中大部分是工程师。因此,我们将高员工数量的职能外包,例如晶圆厂(正如我所提到的,我们使用台积电)和组装业务。因此,我们能够将员工人数保持在非常低的水平。我们的APU拥有独特的技术,我们希望确保保护这项技术。因此,我们积极提交专利申请,公司共有144项专利,其中85项专门针对APU,我们将继续提交更多申请以确保这项技术得到保护。

截至9月底,我们拥有2500万美元的现金及现金等价物,正如我所提到的,这并不包括上一季度之后筹集的4700万美元。市值约为2.7亿美元,内部人士持股比例相当高,为21%。简要介绍一下我们的主力产品线——SRAM,正如我所提到的,我们拥有市场上密度最高、性能最强的存储器。我们的大部分收入来自Sigma Quad系列。Sigma Quad有第二代产品,在某些系列上存在竞争。

我们还有第三代和第四代产品,这些产品没有竞争,我们是独家供应商。过去几年,我们看到许多新的设计订单来自第三代和第四代产品。因此,我们未来的大部分业务实际上没有竞争。这反映在多年来我们的平均售价(ASP)和毛利率都有所增长,因为我们是独家供应商。我们利用这个系列扩展到了一个新的产品线,正如Quinn所提到的,即抗辐射(RAD Hard)或耐辐射SRAM。

这将为我们打开进入太空的新市场。谈到这些市场,本质上我们所做的是将我们的商用产品线进行加固,以能够承受太空中的一些恶劣条件,例如来自太阳和其他区域的辐射。因此,这使我们能够进入以前商用产品无法进入的航空航天应用领域。这是一个不错的市场,因为其平均售价和毛利率都非常高。迄今为止,我们销售的产品平均售价在10,000美元到30,000美元之间。

毛利率都超过90%。这是一个难以进入的市场,进入的设计周期很长,但一旦设计被采用,这就是一个非常容易的市场。生命周期非常长,而且没有竞争。另一个优势是,这是一个不断增长的市场,正如你所看到的。几年前,这是一个20亿美元的市场,到2032年,预计将增长一倍以上,达到近50亿美元的市场规模。因此,本次演讲的其余部分我将重点介绍APU。

APU是一款AI芯片,我们专注于边缘计算。我们将讨论为什么这是我们的战略。如果你看边缘半导体市场,它正呈现出巨大的增长。今年,我们预计市场规模略低于70亿美元,而五年后将超过160亿美元。我们拥有非常独特的技术,正如我在谈论专利时所提到的。我们拥有真正的存内计算架构,我强调“真正”是因为有些公司虽然也谈论存内计算,但并非真正的存内计算。

他们拥有的是所谓的近存计算,即实际上将存储器靠近计算元件,但它们仍然是分离的。我们将讨论为什么做出这种区分很重要。另一个优势是,我们的设备(Gemini 1和Gemini 2系列)上有数百万个位处理器。这很重要,因为它使我们能够进行大规模并行处理。我们能够使用这些百万位处理器同时工作。如你所知,在AI市场中,并行处理是关键。如果你看CPU,它们有几十个计算核心。

如果你看GPU,它们有数千个(约2000个)ALU核心。而正如我所提到的,我们有一百万个。因此,我们可以将并行处理发挥到极致。这张幻灯片展示了APU与GPU的架构有多么不同。左侧是APU,可以看到位处理器或计算元件直接与存储器相连,它们实际上是一体的;右侧是典型的GPU结构。数据存储在DRAM存储器中。

为了让计算元件进行处理,它需要获取数据,在GPU中,数据必须通过L2缓存,然后通过L1缓存和寄存器才能到达计算元件。显然,这需要时间和功耗。请注意箭头是双向的,因为一旦计算元件获取了数据,它需要将数据写回存储器。因此,现在必须通过相同的结构返回,经过不同的缓存回到存储器。

显然,这需要时间和功耗。现在,我们的位处理器还有另一个优势,即我们的分辨率或位宽不是预先确定的。如果你看GPU,它的内部元件基本上是预先布线的,使其要么是32位、16位或8位分辨率,你只能使用这些。我们是位引擎,不关心你如何构建它。你可以使用1位、10位,或者1到100万之间的任何数字,这就是你可以实现的分辨率。

这一点很重要。哦,顺便说一下,分辨率可以逐周期变化。例如,你决定使用8位模型,下一个周期可以改为6位或16位。因此,它不是固定的。这很重要,因为研究人员在尝试优化模型时发现,不同的位宽是最优的,其中一些不适合GPU。例如,假设是12位,那么你将使用16位GPU,使用12位,然后基本上浪费4位。

因此,这是低效的。而对于我们,你可以精确地构建你想要的分辨率。还有许多新的用例,如量化,试图使用更低的位分辨率来处理这些庞大的大型语言模型。数据库变得非常大,他们发现1位、2位或3位分辨率很重要。同样,我们现在就能做到这一点。我们不必等待未来的设备来实现该分辨率,我们现在就拥有这项能力。因此,正如我们所提到的,目前我们有两个系列产品。

第一个系列Gemini 1实际上是为了展示我们的独特技术而设计的。不过,我们已经为一些应用开发了一些模型,包括SAR(合成孔径雷达)应用。如果你观看CNN,可能会看到有关乌克兰局势的报道并显示图像,很可能他们展示的图像是使用SAR设备创建的。我们已经做到了这一点。Gemini 1的市场实际上需要基于地面,因为我们必须将其连接到带有FPGA的板上。

因此,Gemini 1实际上是用于展示技术的。几个月前,康奈尔大学发表了一篇论文,将我们的APU与英伟达的GPU进行了比较。他们使用的是第一代产品Gemini 1进行RAG应用,结果表明我们的架构比英伟达的GPU功耗低98%。我将更多地关注Gemini 2。Gemini 2的独特之处在于,与Gemini 1不同,它不依赖于板卡。因此,如果我们愿意,可以将其作为芯片出售。

它也可以安装在板上或服务器中的多个板上。但现在它可以以芯片形式存在,这使我们能够更接近边缘。我们正在追逐的一些早期市场,这与我们在军事国防领域取得的一些成功有很大关系,即军用无人机和无人驾驶飞行器(UAV)。这款设备有很多不同的应用。正如我所提到的,我们可以进行SAR图像创建,也可以进行目标检测。由于这两个特性,它使我们能够在GPS拒止环境中实现自主无人机。

再次,如果GPS被干扰,你可以使用我们的设备创建你正在飞越区域的图像,然后通过目标检测识别你的位置并使用这两个特性进行导航。我们昨天宣布与G2Tech公司建立合作伙伴关系,同时与美国国防部(前称Dow)合作开展无人机应用的概念验证(POC)。实际上,这不仅仅是无人机应用,它实际上是一个多模态VLM模型,同时使用摄像头和无人机。因此,该POC使用Gemini 2进行,我将详细介绍这一点。

由于我们的设备功耗极低,这使得许多此类无人机的任务时间得以延长。我们的下一代产品是Plato。如果你看Gemini 1和Gemini 2,它们非常适合向量搜索。我们的架构设计是内部带宽非常高,而通往存储器的带宽较低。我们这样做的原因是我们通常会将模型集成在我们的设备上。现在,为了处理大型语言模型(LLM),如果你熟悉它们,你会知道数据库规模非常庞大,无法集成在一个设备上。

因此,必须访问外部存储器。因此,我们所做的是大幅提高通往外部存储器的带宽。因此,Plato将真正用于处理LLM,但不是数据中心中的LLM,而是边缘的LLM。我们将讨论为什么这很重要。正如我们所提到的,我们专注于边缘。许多应用正在从云端过渡到边缘。我们看到的是,显然他们需要将工作负载移至更接近发生地的位置。我们还发现,云计算成本变得昂贵,特别是对于一些较大的模型,在云端来回传输变得昂贵。

此外,还有许多应用,特别是军事和国防领域,任务不允许离开本地设备。他们不希望数据通过云端传输,因此必须保持在本地。此外,许多应用需要实时决策或识别,没有时间通过云端传输。因此,我们发现这些边缘应用确实需要每瓦计算效率非常低的架构。这正是我们的APU所提供的。如果你看我们正在解决的问题,正如我所提到的,我们确实专注于边缘,早期特别关注军事国防领域,因为我们认为这是低垂的果实。

但如果你看我们目前的路线图,我们现在拥有Gemini 2,硬件已经准备就绪,是我们的量产硬件。我们仍在软件开发方面进行一些工作,这也是我们筹集4700万美元的原因之一,正如我提到的Plato。Plato的流片将在2027年初完成,大约一年后。我们预计,最好的情况下是2027年底,但实际上量产将在2028年开始。

我们已经有合作伙伴在讨论下一代设备,他们非常希望采用更先进的工艺节点架构。我提到的我们一直关注的领域之一是军事国防,因为我们在这些市场有很多进展。我们已经获得了340万美元的SBIR(小企业创新研究计划)资助,这可以视为政府拨款。这还不包括我们昨天宣布的POC。我将单独谈论这一点。但我们在太空发展局获得了第二阶段胜利,在空军获得了第二阶段胜利,去年在美国陆军获得了第一阶段胜利。

我们最近宣布,我们的一个第二阶段项目获得了延期,额外获得71.5万美元,用于对我们的Gemini 2进行波束测试,看看我们的商用设备在没有任何增强的情况下表现如何。具体回到与G2Tech的POC,正如我们所提到的,这是与美国国防部和另一个希望保持匿名的外国国防机构合作的。

因此,我们将获得略超过100万美元的POC资金。我们目前正在优化上一张幻灯片中提到的TTFT(首次令牌时间),以便在今年夏天进行完整演示。至于未来的SBIR,我们已经提交了一些申请。我们已经提交了约600万至1000万美元的申请,正在等待答复。

我们还提交了一份名为“广泛机构公告”的提案。这些可以视为更高级别的SBIR,价值可能高达4000万美元。我们目前还在寻求开展STRAPFI计划,该计划基本上由私人方和政府机构提供资金,并由App Works匹配,我们谈论的资金数额在1000万至2000万美元之间。最后,在资金方面,我们一直在与一些主要承包商和国防承包商积极对话,以建立战略关系,这也将涉及一些研发资金。

因此,如果你看财务回顾,季度收入一直在增长,正如我所提到的,本财年我们的同比增长率预计约为20%。在此期间,我们的运营费用有所下降。正如我所提到的,截至9月底的现金及现金等价物为2500万美元,但这不包括10月份筹集的4700万美元净资金。因此,在演讲的最后,正如我所提到的,我们确实专注于边缘,这既是因为我们看到市场对我们设备的浓厚兴趣,

也是因为我们独特的低功耗架构使我们能够在这里取得成功。而且,正如我们所提到的,我们看到了向边缘的真正转变。我知道很多人专注于数据中心,但未来边缘将是大量业务所在。正如我所提到的,我们在国防和航空航天领域取得了良好的进展,特别是通过SBIR和一些POC。有趣的是,当我们与一些客户和合作伙伴讨论时,你知道,有英伟达、AMD,然后在AI领域有很大的差距。

大多数其他公司都是AI初创企业,初创AI公司面临的一个担忧是能否实现量产,特别是对于无人机等产品,量产至关重要。人们逐渐认识到,GSI在AI方面可能是初创企业,但在半导体制造方面并非初创企业。在我们的历史中,我们已经制造并出货了超过1亿个SRAM。因此,我们用于SRAM的制造模式也将用于APU。

同样的晶圆厂(台积电),同样的组装厂。我们将像测试SRAM一样进行自己的测试。因此,我们拥有经过验证的量产制造模式。正如我所提到的,几个月前我们净筹集了4700万美元,我们正使用这些资金来构建使Gemini 2成功所需的软件,同时也使用部分资金启动Plato项目。因此,Plato为了开始设计,我们需要购买一些IP,我们已经能够做到这一点。

因此,Plato设备或系列已经开始设计,正如我所提到的,我们将在2027年初完成设计。因此,我们将在2027年夏天看到首批硅片。Quinn,现在我们可以开始问答环节了。

发言人:Quinn Bolton

太好了。Didier,感谢你的演讲。我想先开始提问。我认为人们对推理的关注越来越多,诚然这可能更多是数据中心的推理。但如果看一些公司,比如英伟达刚刚收购了Grok。我想很多人会说,哦,他们在芯片上使用SRAM存储数据进行处理,因此更加节能。你谈到许多竞争对手使用SRAM进行近存计算,而你们使用SRAM进行存内计算。我希望你能进一步向收听网络直播的人澄清,因为我认为这是一个重要的区别,近存计算不是你们正在做的,你们在根本上做的是不同的事情。我想向收听的人强调这一点。

发言人:Didier Lasserre

好的。你实际上提到了两个要点,我想都谈一下。第一个是SRAM。正如你所说,他们专注于SRAM,因为SRAM在性能和功耗方面是最佳技术。正如我所提到的,30年来我们一直在设计市场上性能最高的SRAM,所以我们是SRAM专家。因此,这项技术与我们的历史非常契合。回到近存计算和存内计算的问题。

近存计算,以前存储器在这边,计算元件在那边,数据传输距离很远。这些公司所做的是将它们靠近,但它们仍然是分离的。因此,数据传输距离缩短了,但仍然存在冯·诺依曼瓶颈,仍然需要传输数据。而我们的架构,搜索或处理直接在存储器位线上进行。因此,数据位于计算发生的地方。因此,我们不需要去获取数据,它已经在那里了。一旦使用完毕,我们不需要将其写回存储器,它仍然在原地。

事实上,APU这个名称曾经更长。现在是关联处理单元,以前称为“原地关联处理单元”。因为数据在原地,不需要获取,也不需要重写。因此,根本区别在于数据位于处理元件所在的位置,我们不需要获取数据。

发言人:Quinn Bolton

非常好,谢谢你的澄清。然后,看看Gemini 1、Gemini 2和未来的Plato将在哪些应用中非常有效。你提到了向量搜索。哪些应用利用向量搜索?你能给投资者提供一些现实世界的例子,说明你们的技术如何应用于一些边缘AI应用中吗?

发言人:Didier Lasserre

是的。向量搜索用于许多应用。可以用于电子商务,例如你在亚马逊上进行搜索并获得匹配结果,这就是向量搜索。向量搜索还用于面部识别、目标检测,以及寻找新的药物分子。这些都属于向量搜索。

发言人:Quinn Bolton

那么内容或上下文处理也是向量搜索的应用吗?即试图在数据库中找到彼此相似的项目。

发言人:Didier Lasserre

绝对是的。这正是向量搜索的本质。当你说向量搜索时,它就是相似性搜索。事实上,这就是我们将第一代产品命名为Gemini 1和Gemini 2的原因。因为Gemini在神话中是双胞胎。所以这正是我们所做的,进行相似性搜索,寻找最接近的匹配。正是如此。

发言人:Quinn Bolton

好的,明白了。昨天宣布与G2Tech以及国防实体(美国国防部)的合作,再次向投资者强调一下,这个POC对于在实际应用中确立Gemini 2的能力有多重要?

发言人:Didier Lasserre

这是个很好的问题。让我们更仔细地看一下这个应用。首先,这是一个自主安全和响应系统。我的意思是,它结合了摄像头和无人机。你可以用摄像头设置 perimeter,但总会有盲点。例如,坏人可以躲在卡车后面或其他东西后面。因此,这就是为什么它还集成了无人机,可以四处飞行,消除盲点。

它可以自主工作。因此,即使系统出现故障,它仍然可以继续工作。本质上,它用于检测并识别是否存在威胁。以前这一直是由人力完成的,人们在监视器前检查一切。在这种情况下,不是“人在回路中”,而是“人在回路上”。我的意思是,不再是由人进行所有监控并判断是否存在威胁,而是由这个自主系统来完成。

它还有一个称为TTFT(首次令牌时间)的指标,基本上是你获取图像或文本的时间。值得注意的是,这是多模态的,我们可以处理计算机视觉或文本,这在目前是比较独特的,然后我们可以确定是否存在威胁。首次令牌时间是指你识别威胁的速度,然后你还需要能够快速反应。我们的Gemini 2的首次令牌时间优于GPU。

GPU的最佳情况是大约6秒获得首次响应,而我们是2.5秒,因此明显更快。因此,显然,如果一架无人机需要6秒识别问题,而另一架需要2.5秒,你知道哪一个会胜出。

发言人:Quinn Bolton

好的。你们正在进行概念验证,试图在今年夏天准备好系统演示。你提到正在将LLM移植到Gemini 2上,进行相关工作。在演示准备好之前,这是你们主要的工作吗?

发言人:Didier Lasserre

是的,这项工作实际上已经开始了。我们已经进行了几个月,大约6个月了。事实上,我们向合作的外国实体进行了初步演示。我们在10月初进行了初步演示,当时算法还远未优化,但当他们看到演示时,印象深刻。另一个有趣的方面是,最初这是为无人机市场设计的,但他们看了演示后说,这可以用于任何类型的车辆,而不仅仅是无人机。

因此,他们预计这可能会在更多用例中应用。

发言人:Quinn Bolton

对于在线的投资者,Gemini 2系统和你们提供给G2Tech或其他无人机的模型的美元含量是多少?一旦系统就绪,是否会引起其他无人机制造商或其他车辆制造商的兴趣,如你所说。因此,如果投入生产,每个系统中的美元含量是多少?

发言人:Didier Lasserre

这是个很好的问题。有两个方面。首先是硬件,在这种情况下,他们将从我们这里购买芯片,即Gemini 2芯片。我不会谈论平均售价,但大致来说,1000美元左右是一个合理的数字。然后是软件内容,他们需要许可我们正在开发的算法软件,无论是首次令牌时间算法、VLM算法、SAR算法还是特定无人机的其他算法。

因此,他们需要许可软件,并为此软件支付持续的订阅费用。

发言人:Quinn Bolton

明白了。有一位投资者提问:你们的SRAM芯片似乎比现有的近存SRAM更具优势。是的。GSI过去三年的收入仅在2100万至3000万美元之间。持续增加收入的障碍是什么?要实现盈利需要什么条件?盈利的时间安排?提问者是GSI故事的新关注者,不一定是半导体专家。

发言人:Didier Lasserre

这个问题包含了几个方面。在SRAM方面,SRAM市场并不是一个增长的市场。我不是说未来不会有应用推动分立SRAM市场增长,但目前市场是持平的。这解释了收入情况。至于增长,增长将来自APU,而APU目前正将这些POC转化为订单。其中一些是软件支持的问题,正如我所提到的,硬件方面我们状况良好,我们已经有量产就绪的Gemini 2芯片,但我们仍需在软件方面努力。

我们已经完成了许多不同的库和功能库,开发了如SAR等算法,正在开发TTFT和其他一些算法,但我们需要让大众能够自己开发算法。因此,我们需要开发编译器堆栈,让人们能够使用Python、PyTorch等高级语言开发自己的算法,并将其翻译成我们芯片能理解的语言。因此,软件方面的大部分工作将是继续编写更多这些功能库,同时将编译器堆栈提供给大众,让他们能够自己开发算法。

发言人:Quinn Bolton

作为对最后一个问题的跟进,听起来Gemini 2的这个POC可能是你们的主要推动力。假设今年夏天的概念验证和演示顺利,需要多长时间才能增加这个特定设计订单的产量?一旦你们现在花钱开发编译器和软件解决方案,假设年底完成,除了与G2Tech的这个POC之外,Gemini的其他设计订单的合理预期是什么?

发言人:Didier Lasserre

首先,要明确POC和编译器堆栈是分开的。对于POC,我们正在编写算法,将其优化,他们不需要做任何这方面的工作。正如你提到的,预计今年夏天完成最终演示。届时,他们将开始评估,可能会做一些修改,但可能在年底会有一些原型出货,假设一切顺利,量产将在2027年。

其他方面,正如我所提到的,我们与政府的一些SBIR项目,例如我们开发了YOLO 3、YOLO 5模型,还有其他一些领域。这些SBIR也为未来的设计订单奠定了基础。至于编译器堆栈,这更多是为其他想要自己开发的人准备的,而不是我们直接合作并为其编写算法的客户。这将是一个持续的过程,因为我提到这是一个堆栈,我们将随着时间推移发布不同的部分。因此,这是一个持续的项目。

发言人:Quinn Bolton

明白了。Didier,我们的会议时间结束了,感谢你参加Needham会议。非常感谢你的出席。

发言人:Didier Lasserre

谢谢。

发言人:Quinn Bolton

谢谢。