David Schwarzbach(首席财务官)
Josh Beck(雷蒙德·詹姆斯公司)
嗨,我是雷·J公司的乔希·贝克。嗨,我是雷·J互联网团队的Josh Beck。我们非常高兴Yelp今天能参加我们的会议。我们请到了首席财务官David。他将快速宣读一份声明,然后我们就开始。如果有任何问题,请举手。
谢谢Josh邀请我们参加此次会议。今天的交流中,我们将发表一些前瞻性声明,这些声明存在风险和不确定性。有关可能影响我们业绩的风险因素的更多信息,请参阅我们向美国证券交易委员会提交的文件。
不到20秒。好吧,我想先从过去几年科技领域的大主题说起,可能未来几年也是如此,但重点是你们的人工智能战略。显然,你们有很多新工具,比如用于餐厅请求报价的助手功能。所以你们在平台上进行了很多创新。我认为还有将其扩展到平台外的机会。那么,能否从总体层面谈谈你们对人工智能战略的看法,目前处于什么阶段,以及未来几年希望将其发展到什么程度?
毫无疑问,我想每个人都清楚,我们正进入一个人们与信息交互方式的新时代,尤其是在搜索方面——过去搜索主要围绕链接和点击,而现在我们正进入一个人们期望获得答案并能够采取行动的对话式时代。我们真正拥抱了这一变化。这不仅仅是我们正在改变Yelp上的消费者体验,而是我们正将人工智能广泛应用于我们所做的一切。我认为可以说Yelp本身正在通过人工智能进行转型,而不仅仅是产品转型。
所以我们拥抱了人工智能,我们认为它为我们带来了巨大的机会,原因有几点。首先,在这个时代,人类生成的内容是必要的、真实的、有见地的、可信赖的。显然,我们以精心策划内容并确保其可信度而闻名。这是第一点,评论和评分显然是Yelp的核心资产。第二点当然是技术能力。我们相信我们在将人工智能应用于实际问题方面做得相当不错。我认为“实际”这个词是我们目前的重点。
我想其他许多公司也意识到,关于人工智能能做什么,显然有很多崇高的想法。但归根结底,你能否做一些实际的事情,对消费者以及在我们的案例中对广告商有益、有用且有价值。因此,我们在构建Yelp助手产品(我们可以详细讨论这个产品)以及推出两款语音产品方面都专注于此,我们认为这两款语音产品在语音和交互方面肯定处于当前能力的前沿。我们不仅在Yelp平台上,也在Yelp平台外开展这些工作。因此,从广义上讲,我们认为我们能够真正利用这个时刻。
Yelp真正让我印象深刻的一点无疑是其可信内容的规模。我认为每月活跃用户近3000万,超过700万家企业,超过50万个付费地点。这是一项非常独特的资产。当然,其中一些内容在谷歌上也能找到,但除此之外,真的没有类似的平台了。当我在ChatGPT或Perplexity上进行搜索,尤其是进入餐厅类别时,它们引用的评论相当晦涩,或者甚至不一定是真正的评论。你知道,它们可能引用维基百科。没有人会在维基百科上寻找餐厅评论,但这显然似乎存在潜力。但我想你们已经与其中一些平台进行过讨论,对吧?那么,能否帮助我们理解这种合作关系。显然,我知道数据授权一直是你们的重要举措,但你们如何看待它的发展?
当然。从独立用户的角度来看,根据comScore的数据,这取决于月份和季节,但我们的月度独立用户在7000万至8000万之间。我们每年公布实际数据,所以当我们按平台报告第四季度收益时,会公布具体数字。但毫无疑问,如果你想进入本地搜索,或者更广泛地说,进入搜索领域,很大比例的搜索——估计差异很大,但我们听说谷歌上25%至40%的搜索具有本地意图。
所以,如果你想进入搜索领域却不是谷歌,我们相信我们拥有最全面的本地企业目录,结合我们数亿条评论和评分——正如我已经提到的,这些评论和评分经过积极策划以确保质量。而且你必须拥有一个能够提供这些内容并满足技术要求的平台。因此,我们相信我们处于非常有利的合作地位,目前,例如,我们在苹果地图、Alexa以及很大比例的汽车信息娱乐系统中都有合作。我们拥有相当广泛的合作伙伴关系。在收益电话会议上,Jeremy对此有所提及。我想你可以从他的声音中听到对正在进行的讨论的热情。我们目前没有任何宣布,但我们认为,如果你想做好搜索,就必须做好本地搜索。我们认为我们是为消费者提供这种体验的卓越合作伙伴。因此,我们觉得自己处于非常有利的位置。当然,在质量方面,还有另一个维度,那就是品牌资产和品牌认知。如果你看到一个评分,比如4.4分,但你不知道来源,可能是引用的,但你不知道来自哪里。
或者你举的维基百科的例子,人们不会认为维基百科有权威性,但当你看到Yelp的标志或名称旁边有一个评分时,它就传达了权威性。我们做过AB测试,看看人们是否会以更高的频率点击。我们做过定性研究,很明显,在另一个网站上,评分旁边的Yelp品牌非常重要。
好的,这非常有帮助。也许回到你 earlier 提到的实际人工智能应用的一些观点。目前助手功能处于什么阶段,与明年的路线图相比可能会有哪些发展?显然,对于请求报价流程,它看起来非常高效,最后有很好的总结,然后你可以请求专业人士列表。所以它显然是附加价值的,而且似乎正在增加更多功能。比如在餐厅标签中,你想知道食物是否辣、辣到什么程度,或者卫生间怎么样之类的随机细节,而不是高级别的信息。
看起来它像是在增加另一层体验。那么目前它处于什么阶段?客户参与度如何?你认为它会走向何方?
是的,我们开发Yelp助手是专门针对我们的“请求报价”产品的——可能有些不熟悉的人还不知道,这个产品能让人们找到服务专业人士并提出一些问题,以便我们将消费者与服务专业人士匹配。我们认为这不仅是更好的体验,还能为匹配算法获取更有用的信息,因为它是动态的、特定于上下文的。因此,我们在这方面投入了大量资源。人工智能的一个有趣之处在于,你第一次使用它时,会有巨大的“哇”效应——太神奇了。
这听起来像真人,太不可思议了。它能呈现有趣的信息。当然,它并不总是可靠的,所以需要大量工作来确保其可靠性。但另一件事是,这只是创造良好用户体验的起点。我们发现,为了创造有用的体验,需要大量的实验、迭代和对用户体验的思考。因此,我们基本上花了过去一年的时间来做这件事,现在我们正在向所有类别推出。这种你可以进行对话、它可以提示你问题的想法非常强大。
它为产品内营销提供了很多机会。所以我们正在推出,实际上现在正在测试一个适用于所有类别的助手,而不仅仅是现在在企业页面上看到的餐厅等类别,而是所有类别。所以目前处于有限发布阶段。我们继续围绕这一点进行实验,我们对未来与用户互动的方式感到兴奋。正如我所说,显然我们都认为我们正在进入这个新时代。
那么将Yelp助手扩展到平台外呢?听起来今年它在平台上会更加普及。你如何看待平台外的机会?
我们认为那里有巨大的机会。它可以采取几种不同的形式。我们有传统的授权业务,通过API提供Yelp内容。现在,我们的API还能够调用我们的助手功能。我认为未来会怎样仍是一个悬而未决的问题——是否会进入一个助手调用其他助手并表明正在调用其他助手的时代?它只是呈现信息吗?人们更喜欢使用每个助手还是独立使用它们?我认为消费者偏好仍在形成中。
显然在应用方面,自近20年前iPhone问世以来,在美国,人们的体验仍然是为他们想做的事情选择特定的应用。美国没有超级应用。我不认为我们会最终进入一个只有一个超级助手,我只用一个助手来做所有事情的时代。我认为这实际上不符合美国消费者的偏好。因此,我的预期是,你会发现人们希望在其他助手体验中使用特定的助手。
这可能出现在各种不同的平台上,例如Alexa等。因此,我们正在构建所有能力来支持这些体验,但现在还处于非常早期的阶段。
好的,这非常有帮助。那么关于语音产品,Host和Receptionist的早期反响或反馈如何?有哪些早期经验教训?
是的,这是一个非常有趣的新兴领域,这些语音产品有几个非常重要的属性。然后我会谈谈到目前为止我们得到的有限的定性反馈,因为现在还为时过早,产品推出才几周。关于这些语音助手,首先要避免的是,当人们听到它的声音时不会立即挂断电话,它不能听起来像机器人,必须听起来像人类,并且需要在最初几秒内传达这一点。因此,对低延迟、类人声音、抗干扰能力以及处理各种情况(例如电话质量可能很差)的需求非常高。
例如,它需要能够处理各种不同的语音条件。因此,我们在技术方面花了很多时间来创造最初的参与时刻和体验,以确保人们不会说“转接给人工”或挂断电话。对于任何想要构建这些产品的人来说,这是第一个障碍。关于语音到语音、语音到文本再到语音有很多讨论,我认为这方面有很多新进展。但我们对我们在前端构建的能力感到非常满意。
当然,它还必须有用。所以它必须连接到很多其他系统,并且必须快速完成。因此,创建人们愿意使用的产品并非易事。而且除非消费者愿意使用,否则企业不会购买,因为否则它无法提供价值。这就是我们一直关注的重点。初步反应是积极的。人们发现语音质量非常令人印象深刻,并且看到它可以处理广泛的问题,并且拥有大量相关知识。
我们做了很多工作来调整它。我还想说,现在还为时过早。为了确保体验有效,还有很多迭代工作要做。非常明显的一点是,服务专业人士或餐厅老板需要参与进来,以确保他们拥有的内容以及他们想要传达内容的方式被输入到为其业务调整的人工智能中。他们必须参与。因此,实施过程很重要,并且让他们能够轻松输入可以为其业务人工智能提供信息的内容也至关重要。
所以你可以再次看到,我们都有一种看法,认为人工智能很神奇。但现实是,要使这些东西有用,需要大量的工程和产品工作。我认为这就是我们关注的重点,而且整个行业也逐渐意识到体验质量对于采用至关重要。
是的,我认为这是一个很好的观点。我认为我们都对糟糕的机器人电话有很多不满。如果你听到那种声音,你会立即想接通人工。这是过去几十年的情况。你必须克服这种习惯,获得更好的体验。
没错,没错。“转接给人工,转接给人工……”交互式语音应答系统。我不喜欢这种体验。而我们正处于这些产品的临界点,人们会说“哦,是的,这很有用,很有趣,回答了我的问题,偶尔还显得有点幽默。”
是的。关于你最后一点,这些企业需要多少数据?你说肯定需要他们付出一些努力。
是的。当然,Yelp的优势之一是我们拥有这个目录,我们已经有很多关于企业的信息,还有所有的评论。因此,与其他一些公司相比,我们的优势在于我们已经将所有这些信息预先填充到体验中。因此,当我们为特定企业演示产品时,它已经是针对其业务的。但他们可能有很多偏好。首先,他们可以选择声音本身。随着时间的推移,我认为我们将提供一种功能,让人们如果愿意,可以录制自己的声音并创建相应的体验,这在技术上是非常可行的。
但同样,设置需要一些工作。所以这是一个方面——“我希望它听起来像我”是即将推出的功能,但我认为对人们很重要。但更多的是“我希望它这样回答”或“我希望它的语气是这样的”,或者如果是下班后,我希望以某种方式与对方互动。你必须让企业主能够根据自己的偏好定制体验,并且必须以不需要额外工程工作的方式来实现。这就是其中的诀窍。
采用曲线如何?我们正处于人工智能曲线的尴尬阶段,智能方面取得了巨大进步,对吧。某些领域确实起飞了,客户服务和这个语音领域似乎是真正的天然优势领域。但似乎也需要相当多的工作才能使产品达到市场契合度,变得更好或与人工相当。那么,你认为这是2026年发生的事情,然后2027年可能是采用率拐点吗?或者你如何看待这个问题?
显然,这有点难以预测。我认为我们处于S曲线的平坦进入点,然后肯定会有规模化的时刻。那是在8个月、16个月、24个月还是32个月后?我认为这有点难说,但我非常有信心在三年内它将无处不在。但今天还不是无处不在。还有很多东西需要学习,消费者偏好还没有完全形成。好吧,让我们从人们开始说起。所有的人工智能产品基本上都可能存在错误。
当你进行调查时,你会发现很多人使用这些产品,但信心很低。这是我们最近从定性研究中获得的一个有趣见解——很少有人说“我既使用它又信任它”。他们说“我经常使用它,但我需要验证它”。这正是Yelp的用武之地,因为权威性在于引用评论中的内容。你可以提供证据。我认为搜索产品周围的另一个动态似乎是不愿意从产品中链接出去。
我认为这在各个平台上基本都是如此。然而,人们想要链接,他们想亲自去看看,他们想验证信息是否准确,或者他们想获取更多关于他们正在探索的特定问题或主题的信息。因此,我们再次认为我们处于有利位置,可以提供证据证明他们得到的答案是准确或可信的。
大家有问题可以举手。我要稍微转换一下话题,谈谈财务方面。在服务业务中,显然它一直表现突出,最近是低两位数或高个位数增长。未来一两年,该业务的关键驱动因素是什么?你如何看待其增长的持久性?
因此,正如关注我们的人所知,在过去几年中,我们的收入结构中服务业务的占比大幅上升。我们即将接近广告收入的70%来自服务业务。尽管我想说,从广义上讲,消费者仍然因为餐厅评论而了解Yelp。这一成功的部分原因在于我们能够区分餐厅零售和其他业务与服务业务的体验。请求报价功能在其中发挥了重要作用。因此,我想说这种向对话式界面的转变确实是下一阶段。
正如我 earlier 提到的,它不仅重要,因为我们可以通过对话动态获取更相关的信息和更少的问题,而且我想我们都有过这样的经历:助手在互动结束时会问你一个后续问题。“我能为你做这个吗?”“你想了解更多关于那个的信息吗?”我真的认为这是推动参与度的下一阶段。“嘿,我看到你雇佣了水管工。怎么样?你想留下评论吗?”或者“我看到你做了一些景观美化工作。今年春天你清理过排水沟吗?”或者“你知道吗,我……你去过那家意大利餐厅吗?你知道Yelp也提供服务吗?”或者“你有服务需求吗?或者你需要水管工吗?”从广义上讲,这是用户体验的一个完全不同的动态时代,我们肯定会关注这一点。因此,归根结底,服务专业人士想要高质量的潜在客户,这是他们重视的。我们想要做的是将消费者与合适的服务专业人士联系起来,并通过将他们与合适的服务专业人士联系起来,继续与他们互动。
因此,我认为这对每个人都有好处。另一个肯定正确的是,这种对话式的用户体验可以以更高的费率货币化,而不会让用户感觉到广告负载增加。因此,当人们今天通过传统的请求报价流程(即问题树)时,通常会看到四家付费广告商的企业,这些广告商为被展示为这四家之一而按点击付费。当结果显示在我们的消息中心时,当你转向这种对话式界面时,很可能……嗯,这就是请求报价。
所以我们在点击方面也有同样的4倍效果,但广义上讲,这使你能够展示付费广告的企业。但这有一个真正的限制,即你仍然希望能够展示这些自然结果,消费者不会满足于只看到付费广告商的企业。因此,我们在所有这些方面都非常关注消费者体验,因为我们希望为人们提供价值,并且需要围绕所有这些进行迭代。因此,即使没有更高广告负载的感知,你仍然需要确保高质量的体验和发现。
所以我们都在学习如何做到这一点。我认为任何平台都还没有完全弄清楚什么是理想的体验。我预计在这方面会有大量的实验。就像搜索在大约十年的时间里逐渐形成了最佳体验一样,我认为我们在人工智能对话方面也会看到同样的情况。
与通过问题树相比,通过助手流程的转化率是否有所提高?我的意思是,这显然是来自更广泛搜索领域的信息。当你进行更长的查询时,你有更多的上下文,可能点击更少,但转化率更高。你们是否也看到了类似的情况?
我们在第四季度电话会议上分享的一个数据是,通过Yelp助手的请求报价请求增加了400%。这部分是因为我们增加了更多的入口点,但也反映了人们选择使用它。因此,我们感觉参与度更高,获得的信息也更好。有趣的是,当我们第一次推出时,实际上匹配算法的表现比问题树差。我们对此感到非常惊讶。这发生在去年。我们想,我们从消费者那里获得了更好的信息,但匹配效果却更差,为什么?原因是算法是针对问题树进行调整的,而不是针对从消费者那里获取的这些新信息进行更好的匹配。因此,我们实际上必须重建匹配算法,以使用这些更好的信息并更准确地进行匹配。这是一个意外,这只是在创建这些新体验时不同系统之间意外交互的一个例子。我们从中学到了很多,并通过实验不断改进。所以我们真的处于那个阶段,随着我们能够推出它,我们感到非常乐观。Yelp确实通过实验驱动的敏捷开发来处理产品开发。这是我们的方法,我认为它非常成功。我们的产品开发速度要快得多。我们对第三季度的发布感到非常自豪。你可以在股东信中看到我们正在做的所有事情。产品开发速度很快,未来还有很多东西要推出。
那么在利润率方面呢?随着应用程序可能更多地融入助手功能,这一直是一个大话题。你如何管理利润率结构?我关注的一些公司可能收购了人工智能原生应用,他们在一定程度上看到了利润率压力。你是否认为这在某种程度上是一个创造机会的投资周期?你如何看待利润率?
我们没有这种经历。有趣的是,我们在模型上的实际支出并没有显著增长。有所增长,但不是显著增长。实际上大幅增加的是,我们使用AWS,我们在数据上的支出比过去多了很多,而不是在模型上。此外,我们构建这些系统的方式有几个要点。第一,我们可以交换任何模型,所以我们不依赖单一模型。我们一直在关注开源和付费模型,并且我们在不同模型之间分层计算,因此你可以使用成本较低的模型。
当你第一次输入查询时,有一个监督模型:“嘿,这是一个有效的查询吗?这个人是不是在问不合适的问题?它是否与主题相关?”有一长串你需要围绕该查询检查的事情,以确保它是一个好的查询,一个安全的查询,可供我们在实际模型中处理。所以这实际上可以用一个成本相当低的模型来完成。然后当你实际需要回答时,语音端和文本端是不同的。然后你实际上想本质上最小化“思考标记”。
你希望“思考标记”用于查询的核心部分,而其他所有部分都使用低成本标记。所以我们已经——因为这还不是一个问题,所以我们没有过度关注费用。但整个行业最终将在体验的这些不同部分分层标记以管理成本。由于竞争,这些模型的成本也大幅下降,我们显然对此表示欢迎。市场上有很多付费和开源模型。因此,我们也能够利用这一点。
所以我听说其他平台看到了显著的成本。到目前为止,我认为我们在管理这些成本方面非常有效。
好的。嗯,我认为这是一个很好的结束点。谢谢你,David,抽出时间,也谢谢其他所有人的参与。
谢谢邀请我们。
谢谢。