Twilio公司(TWLO)2025财年企业会议

声明:以下内容由机器翻译生成,仅供参考,不构成投资建议。

企业参会人员:

Rodney Nelson(投资者关系副总裁)

分析师:

Taylor McGinnis(瑞银证券)

发言人:Taylor McGinnis

大家好。最近怎么样?希望大家都在享受瑞银科技大会的第三天。我叫Taylor McGinnis,负责这里的SMIDCAP应用SaaS领域。在本次会议中,我们邀请到了Twilio。我非常兴奋,因为我们请到了Andy,他是视频和语音产品副总裁。考虑到语音已成为Twilio以及更广泛CPAS类别中人工智能兴起的焦点,我认为这将是一场非常精彩的对话。

我们还有Rodney,他是投资者关系负责人。非常感谢两位今天的参与。

发言人:Rodney Nelson

不客气。

发言人:Taylor McGinnis

太好了。Andy,或许可以先简单介绍一下你自己以及在Twilio的角色,然后我们再继续。

发言人:Rodney Nelson

当然,听起来不错。感谢邀请。我负责Twilio的语音和视频产品。这包括公司正在开发的所有产品管理、研发工作。团队遍布全球,负责构建所有这些技术,从全球范围内的纯连接服务到我们将要讨论的所有有趣的AI部分。在加入Twilio大约四年半之前,我曾是Twilio的长期客户,服务过上市公司和小型公司。

发言人:Taylor McGinnis

很好。说到Twilio的语音业务,语音并不是新产品。我记得语音API大约在15年前首次推出。那么在过去一年多的时间里,Twilio对语音业务的重视程度有所提高,其背后的驱动力是什么?这真的是人工智能的出现和相关机遇所推动的,还是有其他市场需求趋势在推动?

发言人:Rodney Nelson

当然。是的,这是公司成立时的原始产品。随着时间的推移,电信领域发生了转变,当时企业内部构建一个简单的语音通话应用需要多个步骤以及与运营商的合作等。因此,构建一个API来抽象所有这些运营商的服务,现在已经实现了全球化。我认为我们是为这个时刻而生的。从这个角度来说,我很幸运能够见证语音业务多年来的增长,这种增长是渐进式的,涉及传统语音对话、呼入式呼叫中心应用、呼出销售服务营销等,我们的大多数客户也服务于B2C类型的受众。

在过去几年中,由于人工智能的出现,我们看到了一个增长拐点。语音识别AI模型和听起来非常自然的生成式AI语音模型都取得了进步。最重要的是,大型语言模型(LLM)也爆发了。当这三个要素结合在一起时,就有了所有这些我称之为“坐在云端”的AI。无论这些复杂的模型可能是“为了解决问题而寻找解决方案”,Twilio多年来服务的所有用例都是语音AI可以解决的真实问题。

因此,我认为我们开始看到所有这些AI模型从云端走向“最后一公里”的增长,即每个中小企业和企业的本地电话号码,消费者和企业之间实际对话发生的地方。这就是我们的位置,可编程语音产品的位置,它与AI的接口非常好,可以部署这些用例。所以这是一个长期积累的过程,并非一夜成功,因为建立如此庞大的全球基础设施也需要时间。

因为想要快速扩展的企业和独立软件开发商(ISV)希望能够简单地利用这些服务并覆盖全球受众,同时需要可靠性来满足其不断增长的需求。

发言人:Taylor McGinnis

很好。是的,当Kozaima谈到语音正在经历复兴时,听起来很大程度上是由AI驱动的。那么,在Twilio如何定位自己在语音市场中的位置方面,我希望你能详细说明。Twilio如何通过产品、市场策略的演变来利用这些新兴机遇?

发言人:Rodney Nelson

当然。我认为,从全球电信网络来看,传统的PSTN语音通话随着时间的推移不断发展。这种原始的连接服务并不具备我们在此基础上构建的所有功能。如果你考虑企业可能希望对通话做些什么,比如录音、转录、会议、路由,显然还要在上面部署语音AI代理。对刚刚所说的内容和发生的事情进行分析,然后将这些作为基础设施提供给我们的客户。

例如,ISV可以开展业务并说,我们可以将AI作为市场推广工具,现在我可以作为专注于沙龙和水疗中心的ISV,去向每一个沙龙和水疗中心推广,说现在你可以构建自己的语音AI代理来处理所有预约安排和业务所需的一切,或者在餐饮、零售、汽车等其他行业也是如此。因此,我认为差异化在于将纯连接服务与AI接口的功能。

从市场策略来看,我们的ISV现在正将这项技术推广到所有中小企业,以及信任我们的规模、可靠性和我们为通话带来的一切的企业,以便他们可以开始在客户服务部门或销售和服务部门部署相同类型的功能。我们也在自助服务方面进行了大量投资。正如我所说,我曾是多家企业的客户。

Twilio是我们需要的基础设施公司之一。拥有可以嵌入到应用程序中的简单API仍然是我们的核心优势,特别是在吸引这些新兴的语音AI初创公司方面。他们可能在周六加入,周一就能启动并开始扩展,我们可以看到这种增长。因此,在市场推广方面,重点是让我们的企业客户、ISV能够面向中小企业。

这些开发人员是关键,因为他们是看到如何将这些AI模型应用到语音AI领域的人。

发言人:Taylor McGinnis

是的。现在最受欢迎的用例是什么?它们是如何演变的?因为你之前举的很多例子听起来像是传统的呼叫中心用例。那么Twilio推出的一些语音解决方案是否真的在取代这些传统用例,还是有一系列全新的、尚未被解决的绿地机遇?

发言人:Rodney Nelson

是的,我认为,对于全球范围内处理呼入电话的呼叫中心的运营成本,以及语音AI技术在这方面的应用,肯定正在发生巨大转变。你会看到资金的转移。我们当然在帮助客户实现这一目标。在这些用例中,我将其视为一个复杂性金字塔。在金字塔的底层,有大量的通话,但原因非常基础、重复,例如消费者致电企业的呼叫中心时,“我忘记了密码”“我无法登录网站”“我的包裹状态是什么”,或者“我想重新预约医生,不想访问网站或发送电子邮件,只想在开车时打电话重新预约”之类的事情。随着向金字塔上方移动,通话数量可能会减少,但复杂性会提高。传统的呼叫中心代理面前可能有多个屏幕和两三个不同的软件系统。

在增长方面,我们看到客户确实在追逐金字塔底层的这些用例。当然主要是呼入,但也有呼出。另一个例子是医疗预约提醒。错过医生预约对我们所有人来说都非常昂贵,他们希望触发呼出电话。我们希望确保这个电话带有客户的品牌标识,例如“这是您的医生办公室,您可以重新安排”,这些事情虽然基础且重复,但成本很高,因此客户希望解决这些问题,然后逐步向上发展,与更多系统集成,利用更多数据进行个性化,直到能够让大部分通信由AI驱动。

发言人:Taylor McGinnis

很好。我想请你谈谈竞争格局的演变。在传统语音用例中,会想到呼叫中心参与者、统一通信、其他CPAS参与者,如Bandwidth。现在随着人工智能的出现,有很多你提到的AI初创公司,还有一些云基础设施提供商也在某种程度上进入这个领域。那么当你的客户评估你提供的AI语音代理甚至非语音工作负载时,你通常与谁直接竞争?竞争格局是如何演变的?

发言人:Rodney Nelson

是的,对于那些新兴的AI初创公司,我们看到他们选择Twilio是有充分理由的。我谈到了开发者声誉,他们知道可以加入Twilio,我们有出色的API,运行稳定,可扩展,能够提供全球覆盖,可以扩展规模。因此,我认为这就是为什么我们成为构建者和开发者(无论是企业开发者、大型企业还是语音AI初创公司)事实上的选择,他们信任我们并愿意合作,这也与一些大型云和不同参与者有关。

一些参与者,特别是在语音类别中,主要专注于纯语音连接。我所说的底层就是纯连接,确保通话能够进行,这主要是SIP中继类型的产品,交易量巨大,但缺乏与LLM接口、录音、转录、会议通话、路由、IT安全支付等可编程功能。因此,客户要么必须自己构建所有这些功能,要么选择Twilio的可编程语音服务。

这是一项大型业务,但毛利率不同,转换成本更低,因此我们投资于使这些功能更好地协同工作。这就引出了最后一个差异化因素,一旦你选择Twilio语音,因为它是模块化的、可编程的,可以与任何LLM接口,无论LLM如何变化,你仍然可以插入它,然后我们还有其他渠道的补充工作。因此,在许多语音AI案例中,你可能需要发送DocuSign文本或OTP验证文本以验证用户,例如在更改银行信息或包裹 shipment 之前进行身份验证,或者在语音AI代理完成操作后立即发送电子邮件收据。

这就引入了Twilio的其他渠道服务。你会发现这些渠道更加可信,协作更无缝,集成更紧密。这也是一个差异化因素,不在于渠道本身,而在于能够跨多个渠道进行编排。因为我们认为,不仅仅是语音AI,而是对话式AI,它可以在客户与企业的任何旅程中发生。你可以从网络聊天开始,切换到语音通话,保持身份记忆,再切换回消息传递,反之亦然。因此,当我们考虑多个渠道协同工作时,这就是优势所在。

发言人:Taylor McGinnis

是的,感谢你的解释,我认为连接方面的优势真的很有趣,开箱即用的功能更多成为了差异化因素,这很有意思。我很欣赏你的解释。我认为关于人工智能的出现和Twilio对语音的关注,有一点让我很感兴趣,那就是语音目前占Twilio收入的10%到15%,而Twilio业务的主要份额一直在短信方面。所以当人工智能开始成为一个更大的主题时,我最初以为短信会是重点领域。

那么语音有什么特别之处?是因为语音渠道作为AI代理非常自然,而短信在这方面还比较滞后吗?是什么让你们如此关注语音?

发言人:Rodney Nelson

是的,这是个很好的问题。我和负责产品的同事之间存在良性竞争。我认为,特别是我谈到的这些新兴技术,在几年前真正兴起,现在在语音识别、语音和LLM方面更好地结合在一起。这种结合同时发生,你甚至可以从原生应用(如Gemini或OpenAI)中看到,它们都希望成为你的AI代理,非常以语音为导向,甚至用户界面也鼓励使用语音,因为这是我们最自然、最快的沟通方式。因此,我认为这是一个原因,我们正在培养一代消费者能够对着手机说话甚至大喊。

那么,为什么更改医生预约与向ChatGPT询问世界问题会有所不同呢?因此,我认为这是我们看到的一个趋势,从长期来看,我对语音作为一种沟通方式非常乐观。我还认为,因为企业通过语音渠道处理所有客户和消费者互动的成本很高,无论是外包给BPO还是内部员工处理这些重复性呼叫,回到那个金字塔模型,为庞大的劳动力提供支持。在许多情况下,你无法改变消费者行为。

在医疗保健、零售、金融服务、房地产等垂直行业,语音通话仍然是主流,例如致电当地水管工或其他地方,语音通话仍然是主要方式,而且成本很高,这自然成为客户倾向于部署我所说的对话式AI的领域。它应用广泛、简单,但并不妨碍你回到网络聊天或基于文本的聊天。我们认为,在客户与企业的任何旅程中,任何时候都可以进行对话。

传统上,你通过Facebook广告和Google广告定位客户,他们访问你的网站。为什么他们不能通过语音方式与你的企业就产品、服务、退货等进行对话呢?因此,我认为这是我们看到的有助于语音渠道整体增长的趋势。

发言人:Taylor McGinnis

很好。我认为投资者的一个关键问题是企业现在是否在采用这项技术。我知道Rodney整天都在回答这个问题,有哪些证据?你们有财富500强公司正在使用或测试Twilio的语音AI代理吗?请给我们一些背景信息。当你考虑不同的细分市场,无论是使用Twilio的AI原生公司、中小企业、中端市场还是企业,采用曲线处于什么阶段?如果还处于早期阶段,能否谈谈管道情况和你所看到的情况?

发言人:Rodney Nelson

是的,老实说,我认为我们仍处于早期阶段。我们看到,正如我所描述的,一些原生AI语音初创公司正在看到这些用例,无论是改进传统用例还是针对特定垂直领域,通过垂直特定方式快速增长。至于企业,是的,我们看到企业肯定处于测试阶段,他们正在评估并说,“也许我每小时有1000个关于某个主题的呼叫。”

那么,我如何针对这个特定的呼入或呼出呼叫用例部署语音AI代理?我们拥有值得信赖的全球连接服务。他们可以帮助我打造品牌化的呼叫,让消费者知道。然后,我如何使用内部数据训练模型,将其插入对话中继和对话智能,将其部署到一定比例的流量中进行测试、评估,感到满意后开始扩大规模,然后使用内部数据仓库中的数据进行个性化。

这样AI代理就知道消费者是谁,了解他们的购买历史、忠诚度状态,然后开始扩大规模,再转向另一部分流量。因此,我认为现在还不是将OpenAI模型部署到所有呼叫的阶段,那样效果不会好。这是一种精准的方法。因此,我们在企业中看到的情况很有趣,因为我认为痛点和成本与一些最早进入生产阶段的公司一样高。

我们做过的一些公开案例研究是在医疗保健等受监管的垂直领域。“为什么我的医疗账单这么贵?”“我的下一次预约是什么时候?”处理信用合作社的企业等。在这些受监管的垂直领域,由于人力成本高昂,客户开始权衡。

发言人:Taylor McGinnis

投资回报率。是的,开始部署。Rodney,这个问题你也可以插话,因为我们将涉及一些财务方面的内容。正如我之前提到的,语音目前占Twilio收入的10%到15%左右,而Twilio业务的主要份额一直在短信方面。我最初会认为当人工智能开始成为一个更大的主题时,短信会是重点领域。

那么语音有什么特别之处?是因为语音渠道作为AI代理非常自然,而短信在这方面还比较滞后吗?是什么让你们如此关注语音?

发言人:Rodney Nelson

是的,这是个很好的问题。我和负责其他产品的同事之间存在良性竞争。我认为,特别是我谈到的这些新兴技术,在几年前真正兴起,现在在语音识别、语音和LLM方面更好地结合在一起。这种结合同时发生,你甚至可以从原生应用(如Gemini或OpenAI)中看到,它们都希望成为你的AI代理,非常以语音为导向,甚至用户界面也鼓励使用语音,因为这是我们最自然、最快的沟通方式。因此,我认为这是一个原因,我们正在培养一代消费者能够对着手机说话甚至大喊。

那么,为什么更改医生预约与向ChatGPT询问世界问题会有所不同呢?因此,我认为这是我们看到的一个趋势,从长期来看,我对语音作为一种沟通方式非常乐观。我还认为,因为企业通过语音渠道处理所有客户和消费者互动的成本很高,无论是外包给BPO还是内部员工处理这些重复性呼叫,回到那个金字塔模型,为庞大的劳动力提供支持。在许多情况下,你无法改变消费者行为。

在医疗保健、零售、金融服务、房地产等垂直行业,语音通话仍然是主流,例如致电当地水管工或其他地方,语音通话仍然是主要方式,而且成本很高,这自然成为客户倾向于部署我所说的对话式AI的领域。它应用广泛、简单,但并不妨碍你回到网络聊天或基于文本的聊天。我们认为,在客户与企业的任何旅程中,任何时候都可以进行对话。

传统上,你通过Facebook广告和Google广告定位客户,他们访问你的网站。为什么他们不能通过语音方式与你的企业就产品、服务、退货等进行对话呢?因此,我认为这是我们看到的有助于语音渠道整体增长的趋势。

发言人:Taylor McGinnis

很好。我想请你谈谈语音AI交易的构成部分。据我了解,有四个部分,不知道对不对,包括语音API、软件部分(如Conversation Relay和Conversational Intelligence),我还认为如果客户选择,可能还有一些模型托管成本。那么对于听众来说,你能否描述一下这些组成部分,为什么客户需要它们?或者在某些情况下他们不需要?原因是什么?

发言人:Rodney Nelson

当然。无论是企业还是新兴公司,想要为特定市场构建语音AI解决方案,都不想将所有研发时间用于重建Twilio已经构建的超级网络和所有电信基础设施。因此,这一点很明显,这就是为什么我们看到开发人员受众迅速选择我们。他们可以获取电话号码、购买连接服务、购买可编程语音服务,几分钟内启动并开始构建。

这就是纯全球连接和覆盖,在所有国家/地区提供号码,以及通话正常工作的信任。从可编程语音的角度来看,API中包含所有这些功能,可以快速实现录音、转录、向消费者播放内容等基本操作。因此,语音AI应用是建立在这些基础之上的。

然后我们看到客户不断构建这些功能。因此,我们推出了Conversation Relay,它处理所有语音识别。我们有多种提供商。不幸的是,每家公司都向我推销,说他们拥有全球每种语言的最佳语音识别或最佳生成式AI语音。我们希望为客户提供与电信服务抽象相同的方式,为语音识别和语音提供抽象,因此我们内部有多个提供商。

因此,客户可以配置使用Google、Amazon、Deepgram、11 labs等提供商,这样他们可以快速构建对话式AI产品。然后,Conversational Intelligence本质上是安全加密地捆绑录音和转录,去除个人身份信息(PII),然后在转录文本上应用LLM进行分析。因此,不仅仅是向客户提供原始转录文本,而是进行分析,例如消费者是否提到了各种关键词、是否有流失意向、情绪是否不佳、航班是否取消并希望重新预订等,然后可以通过Webhook触发任何操作。

例如,如果消费者说“不要再给我打电话了”,我们识别到这一点,将其添加到禁止呼叫列表中。或者,这是一个追加销售产品,消费者表示有兴趣开设新账户,这可以触发潜在客户流程等。它还可以帮助训练AI代理,你可以回顾1000次与语音AI代理的通话,应用Conversational Intelligence,获得理解,调整提示和模型,添加更多数据,然后更有信心地投入生产。

因此,从连接和可编程API到Conversation Relay再到Conversational Intelligence,我想说的是这些LLM喜欢模块化。正如Rondi所说,我们处于早期阶段,我们看到客户(无论是ISV还是企业)都希望有选择权,因为他们每天都听到有更好、更快、更智能的产品,他们不想被锁定,希望能够在任何时候部署最佳解决方案。

因此,虽然我们提供这些模块化组件,但我们使它们更好地协同工作。因此,你可以快速启动,同时不会陷入黑箱困境,也不会因组件过多而无法快速启动。你希望能够快速启动,但有选择权,可以随时添加或删除组件或数据。

是的,这就是客户在购买与构建之间的选择,他们说:“你有这些组件,但你也给了我选择权。因此,六个月或一年后,我可以添加更多功能,使其越来越好,从而将企业用例投入全面生产。”

发言人:Taylor McGinnis

是的,我认为Conversation Relay有很多令人兴奋的地方,特别是因为它是一个高毛利率的软件产品。我们将讨论其潜在的增长,但据我了解,云基础设施提供商也提供类似服务。我认为有人认为Sierra或其他AI代理平台也可能将其纳入产品中。因此,当你考虑竞争格局时,能否谈谈Twilio的优势?客户为什么会选择Twilio?为什么可能选择其他解决方案?影响决策的因素是什么?

发言人:Rodney Nelson

是的,当我们观察客户如何使用我们的低级原语时,我们会随着时间的推移抽象出更多的复杂性。从电信层开始,然后是可编程层,然后是如何选择语音识别或语音提供商,这对客户来说只是一个配置。当我们将这些整合在一起时,就形成了Conversation Relay,以及显示其性能的洞察等。Conversational Intelligence也是如此。

因此,当我们看到处于应用层的ISV时,他们可能认为需要构建从原始连接到应用的所有内容。但随着时间的推移,他们会发现Twilio已经完成了这些工作,并且已经连接,整个过程都有洞察。因此,他们可能不需要构建所有这些,可以从Twilio购买这些层,因为我们在这方面投入了更多研发,并且是专家,因为我们观察到所有客户都在这样做。这真的是我的差异化优势,还是我可以从Twilio购买,以便专注于我所针对的垂直领域以及需要集成的20个不同医疗系统,或者我的专有LLM或LLM编排。

因此,我认为这就是我们看到的机会,即基础设施层,同时如我所提到的,他们可能引入的其他渠道,例如,如果想与消息渠道和电子邮件渠道良好协作,Twilio已经在构建这些编排。他们是否真的想将时间和精力以及研发投入到这方面,还是专注于行业特定的事情?

发言人:Taylor McGinnis

是的,非常有道理。我们有最后一个问题,给大家一些可以代入模型的数字。当你考虑这些语音AI交易与传统短信交易的比较时,当包含Conversation Relay、Conversational Intelligence等功能时,追加销售机会有多大?与单纯的语音AI交易相比,这对平均交易规模有什么影响?能否给我们一些背景信息?Rodney,还有一个问题,当你考虑语音AI的机会时,大家对这些软件产品能够增加更高毛利率的组成部分感到非常兴奋。

但也有人认为语音本身的毛利率更高。那么,在语音业务中取得成功是否需要所有这些软件组件?能否谈谈这对毛利率的影响?

发言人:Rodney Nelson

是的。首先,语音AI的一个有趣之处是,Nadia已经详细描述过,我们的许多语音业务实际上是软件。因此,我们确实提供基础连接层,这是我们的有利位置。我们不必为所有人提供所有服务。如果你只想依赖通信轨道,这是我们的核心业务,也是公司历史上一直在做的事情。但正如Andrew所描述的,在基础设施层我们可以做更多事情,这样你就不必将宝贵的资源用于构建我们已经处理并且可以说做得更好的事情,因为这是我们的唯一重点。

你可以在一天结束时更专注于客户体验。因此,在AI对话的背景下,以前你可能只通过分钟数获利,现在你可能在语音通话的基础上叠加录音、转录、Conversational Intelligence、Conversation Relay等,这些通常按分钟额外收费。因此,除了每分钟1美分的可编程语音费用外,Conversation Relay的标价是每分钟7美分。与我们的大多数产品一样,当你扩大生产规模时,会获得批量折扣。

但我们看到客户在每次交互的基础上有显著的增长。但对他们来说,这是成本的大幅降低,因为以前的模式是人工处理呼叫,成本以美元计算,而现在是可编程解决方案,成本以美分计算。因此,投资回报率在实施时就得到了证明,这还不包括最终为消费者带来的更好结果。因此,回到Twilio的损益表,语音在结构上对我们来说是一个更高毛利率的渠道,不仅在连接层,还因为有许多这些软件组件。

因此,这是我们内部投入大量资源开发新解决方案,并调整销售团队以推动更多交叉销售和多产品采用的领域,因为这最终有利于毛利率和毛利美元。

发言人:Taylor McGinnis

很好。我们将以这个问题结束,给大家一些可以代入模型的数字。感谢大家的参与,也感谢你们。感谢今天的分享。让我们为他们鼓掌。

发言人:Rodney Nelson

谢谢。