瑞安·S·斯蒂尔伯格(首席执行官兼董事长)
约书亚·赖利(Needham & Company)
好的。早上好,欢迎参加Needham增长会议。我叫乔希·赖利。今天我将主持炉边谈话,我们很高兴Veritone公司的首席执行官瑞安·斯蒂尔伯格今天能参加。
很高兴来到这里。谢谢。谢谢你,乔希。
好的,在过去24个月里,Veritone发生了很多事情。或许你可以先从更广泛的战略以及媒体代理业务的剥离开始谈起,这对你们纯粹的人工智能战略有何帮助。
嗯,对于那些不了解的人,Veritone是我所说的首批人工智能公司之一。我们在2014年创立了这家公司,那是我在谷歌完成盈利分成后离开谷歌的时候。我们之前的业务卖给了谷歌,而Veritone实际上是源自我在谷歌的经验以及我的广告技术职业生涯中的想法和诞生。在Veritone创立初期,我们实际上最初开发这项技术是为了服务我们的媒体代理公司。和所有事情一样,我们并不是为了技术而凭空想出一项技术。我们拥有一家知名的媒体代理公司,该公司专门从事原生广告业务。
所以,想象一下当主持人或你在看ESPN时,他们正在直播中自然地谈论Geico。我们坚信,需要人工智能来筛选所有这些音频和视频,发现许多有趣的广告机会。就我个人而言,我们家族拥有这家媒体代理公司已经有一段时间了,当我们创立Veritone并开发我们的技术栈aiware时,其目的就是帮助这家媒体代理公司实现转型,而且顺便说一句,效果非常好。最终,我们在Veritone持有这项资产很长一段时间。
最终,在我们创立Veritone公司时,我们将这项资产注入了公司,然后在几年前我们最近出售了这家媒体代理公司,这么说吧,从相关时期来看,它有了非常可观的增值,这意味着技术奏效了。但是,Veritone在业务发展初期,我们最初几年的人工智能重点主要集中在音频上。实际上,我们每天要摄入数万个小时的音频。在短短几年内,我们将平台升级为多模态。这意味着今天我们可能会重点谈论的,我们处理的主要非结构化数据是视频。
简而言之,当时机成熟,并且我们觉得我们拥有足够多样化的多模态客户基础时,剥离那项传统媒体代理业务的时机和机会就出现了,这让我们能够坦率地回到我们的核心人工智能战略,即成为非结构化数据的人工智能公司。这笔交易于2024年10月完成,产生了可观的收益。所以现在,实际上这是解决方案的一部分,坦率地说,是Veritone回归其人工智能核心根源的清理阶段。
明白了。好的。那么在那次剥离之后,去年秋天你们进行了一些相当成功且重要的融资。你们能够偿还一些高成本债务。展望未来,Veritone的投资重点是什么?你们如何在进行这些投资的同时保持健康的资产负债表?
首先,作为首席执行官,我非常兴奋也很感激我已经完成了清理阶段。再次强调,我是一名企业家,我喜欢打造事物,我们喜欢发明东西。我们在之前的业务中取得了很多成功,花了24个月的时间进行了大量清理工作,而且我们成功地做到了。所以我们已经偿还了大部分债务。我们消除了非常昂贵、几乎类似于有毒的定期债务。所以现在我们的资产负债表相对干净。我们有充足的现金来执行回到我们核心战略的业务。
希望这次谈话能变得非常令人兴奋,就像我们未来将要做的事情一样,这也是你正要引导的方向。但再次强调,我认为我们已经度过了清理阶段,这确实花了整整两年时间,因为业务确实如此。我们有超过10年的运营历史。当你有像媒体代理这样的部门,并且你必须基本上偿还近1亿美元的债务时,这需要时间。所以再次强调,我认为我们已经完成了很多公司和财务组织上的混乱和清理工作。现在我们又回到了Veritone的核心,处于一个非常有利的位置。
我们确实专注于我认为人工智能领域中两个最令人兴奋的领域:公共部门。在联邦、州和地方执法领域都有很多事情在发生,Veritone在这些领域非常非常活跃和投入。我会给你们一些关于那里正在发生的事情的令人兴奋的新更新。但在基础设施方面,我们会重点谈论人工智能训练数据,我们在这方面深度参与。我们现在是一级供应商,与大多数大型超大规模企业合作,比如Meta等,我们实际上利用我们在非结构化数据方面的专业知识,帮助他们训练人工智能模型。
所以我认为总结来说,清理工作已经完成,现在回到了加速增长阶段,将我们的专业知识和专有技术应用到人工智能生态系统中可能最有趣和增长最快的多个领域。
明白了。好的,或许你可以解释一下资产标记化的概念,我认为这将有助于引出更广泛的讨论,而且对在座的一些投资者来说可能比较新。
在处理数据之前,特别是非结构化数据,你必须将其分解,对吧?所以实际上,就像谷歌多年前对开放网络所做的那样,试图创建一个搜索索引,对吧?很快,如果你上网并访问google.com进行搜索,实际上谷歌历史上多年来出色地吸纳并创建了开放网络的有序索引。可以把它看作是将其标记化,分解成计算机可读的片段。所以无论是一段长长的粤语段落,还是ESPN上的体育文章,谷歌都必须将该数据结构标准化。
这样当你我快速搜索时,我们就能得到答案。当你谈论像音频和视频这样的非结构化数据时,你必须做同样的事情。机器本身无法原生读取它们。也就是说,机器不能只是简单地读取和查看视频。实际上,你必须把它想象成打包。所以你必须应用人工智能对其进行标记化,分解成计算机可读的片段。所以实际上现在我们可以像在基于文本的网络上那样搜索音频和视频。
所以实际上,比如说,找出所有迈克尔·乔丹打篮球的镜头,背景中有耐克标志,并且在5分钟的时间范围内有人说“他是有史以来最伟大的吗?”假设你现在可以大规模且非常快速地做到这一点。所以可以把标记化再次看作是将非结构化数据分解并转化为非常结构化的元数据的过程,使其能够进行语义搜索或应用到我们稍后将要谈论的其他领域,比如公共安全等领域。
是的。
好的,公共安全是我在研究我负责的其他一些公司时涉及较多的领域。显然,在推动技术采用以提高安全性和投资回报率方面有很大的势头。政府停摆显然是一个短期阻力。但除了这个暂时的问题,你能谈谈2025年在公共安全方面,无论是联邦还是州和地方层面取得的一些成功吗?
嗯,好消息是,尽管我们刚刚谈到做了很多公司清理工作,对吧。2025年对于业务来说是增长和创新的重要一年。具体到公共部门,我们将公共部门分为两个主要部分:州和地方执法部门以及联邦政府,包括国内和国际的。在州和地方执法领域,我们现在有数百个警察机构和治安部门使用我们的软件来筛选大量的音频和视频,以帮助他们起诉案件、进行调查等。例如,我现在可以告诉你,我们在州和联邦层面都深度参与司法部的爱泼斯坦案。
因此,我们的软件基本上被州检察官办公室和犯罪小组使用。在这个案件中,我们是一级软件和技术解决方案。无论你对爱泼斯坦案有什么看法,我们现在是一个基本工具,帮助筛选新的证据以及可以追溯到几十年前的证据。正如你们所知,有很多音频和视频。好吧,想想看,这只是一个案件。但想象一下,现在在每个司法管辖区,我们人类正在产生大量的数据。
音频和视频是其中很大的一部分。现在你不可能不被拍摄,对吧?想想看。这些拍摄这场炉边谈话的摄像机。每个司法管辖区的每个街角都有摄像头。每个消费者都有公民上传摄像头。当发生不好的事情时,必须收集证据。无论是大案还是小案,你可能都要处理数万小时的素材。例如,如果是安全录像,你试图找到一个在黑暗小巷里行走的嫌疑人,99.9%的内容都是无效时间,对吧?所以让人类去筛选和查看所有这些东西是不符合成本效益的,对吧?我们最初为媒体和娱乐客户推出的解决方案,非常适合应用到公共安全领域。
所以再次强调,这是警察机构如何使用我们软件的一个例子,我们现在已经打入美国几个前五名的警察机构和治安部门,他们现在也在使用我们的软件,更具体地用于音频和视频处理,以加速调查。这项技术现在已经应用,并且我们去年宣布了一些非常重要的合同,成功打入了联邦政府。国防后勤局管理着我们在国内外的所有基地。我们现在是国防后勤局的基本解决方案。可能我们最重要的、花了很长时间才获得的合同是空军合同。
空军的那个部门叫做OSI,即特别调查办公室。可以把他们看作是整个空军的警察、联邦调查局力量,顺便说一下,这是一个很大的领域。对吧。你想想,空军的执法部门。规模很大。但更重要的是,管理OSI的团队的任务是扩展这个解决方案,这是我们联邦政府所有事务中的一个宏观趋势,试图实现标准化,并在17个战争部门机构中推进人工智能发展。空军是第一个,这意味着我们非常乐观地预计,我们在空军的私有云中成功部署的aiware平台将开始被其他17个机构采用。
所以2025年既是清理的一年,也是我们公共安全工作取得重大进展的一年,不仅在技术创新方面,而且在打入联邦政府一些最大实体方面。我刚刚提到了几个例子。
是的,关于爱泼斯坦案,有一件有趣的事情,我想知道这是否是一个差异化点,我们都知道必须进行大量的编辑工作。你们的大规模编辑是你们的一个差异化点吗?
非常大。对于音频和视频来说。是的。需要明确的是,在一些文本编辑方面存在很多负面问题。他们实际上使用另一家公司进行文本编辑,我听说你得到一个编辑后的文件,如果你使用不同的软件,只需突出显示被编辑的内容,实际上就能看到原始文本。需要明确的是,我们被用于音频、视频,不仅仅是编辑方面。还有发现环节。所以,再次强调,这是创造性的,你说的是创建一个索引,这样他们就能筛选并识别每一张脸,每一个说出的词。
而且该解决方案的一部分就是编辑。所以在他们将素材发布出去之前,显然你会看到某些个人,可能是受害者,他们的脸被模糊处理,实际上,我们不仅仅是隐藏他们的声音,我们实际上使用合成人工智能声音改变他们的声音。所以实际上,如果你在听,你仍然需要听到人们在说什么。我们想听到人们在说什么,但不想侵犯他们的隐私。所以我们实际上几乎是实时地使用合成人工智能改变他们的声音,这样你就能得到真实的内容呈现,但不会泄露他们的个人信息。
非常酷。非常酷。好的,那么展望2026年,投资者显然会问很多关于你们解决方案资金的问题。或许你可以谈谈你所看到的州和地方客户与美国联邦客户的预算动态。
完全不同。我的意思是,预算方式可能完全是天差地别。重要的是,我们为客户部署和运行的每个应用程序、每项服务都建立在相同的技术栈aiware上。所以可以把它看作是同一个操作系统。就像你可以在Microsoft Word上,抱歉,在Microsoft Windows或其他操作平台上构建应用程序一样,这创造了巨大的效率。所以当我们必须构建新的解决方案时,无论是为明尼苏达州的伊登普雷里的一个警察机构构建编辑软件,还是为空军构建定制应用程序,都是基于相同的基础设施。
为什么这很重要。在内部,这非常具有成本效益。一个通用的代码栈,实际上是完全相同的代码集和栈,既部署在商业云中,也部署在私有云或空气隔离环境中。所以从软件开发的角度来看,转换非常非常高效,这对我们来说非常具有成本效益。所以当我们能够偿还债务,在改善资产负债表方面非常有纪律时,看看我们今天所处的2026年以及未来,我们确实认为与竞争对手相比,在继续推进我们的平台方面,我们将非常非常资本高效。因为再次强调,我们已经完成了艰苦的工作,对吧?所以Aiware已经存在了。我们实际上在近10年前就推出了它,所以显然我们一直在不断推进它。现在,我们今天早上实际上发布了一份新闻稿,谈论总统和战争部部长刚刚推出的人工智能加速计划,如果你读了它,几乎就像是在描述我们的平台,非常明确,对吧。开放、模块化、模型无关,能够部署在任何类型的环境中。我们已经进行了这些投资。所以我认为从股东的角度来看,你现在将从过去做出这些投资的远见中受益,以及我们过去想要构建该解决方案的方式,这将使我们在继续进行更多的市场投资而不是过度投入基础设施或技术投资时非常非常资本高效,如果这说得通的话。
对,非常有趣。好的。那么,考虑到公共部门未来的产品路线图,你如何考虑向客户销售aiware平台与销售单个应用程序?或许你可以谈谈这些客户的典型切入点是什么。
这是个好问题。所以对于一些州和地方执法客户,根据不同的司法管辖区,他们的预算有非常明确的限制,如果你试图引入某种东西,它可能会推迟到下一次市议会投票。对吧。所以即使他们想要这个解决方案,他们显然有预算阈值,所以他们可以像你知道的那样批准它。嗯,我们平台的优点是客户可以来找我们购买完整的AIware栈。我们将公共安全的解决方案称为智能数字证据管理系统。它就像Microsoft Office。
这是一套应用程序,他们可以用于许多不同的用例。但我们有意这样做,因为现在如果他们的预算有限,他们可以通过授权开始使用我们的一个应用程序。对吧。这刚好低于预算阈值。例如,在加利福尼亚州,编辑需求很大。对吧。实际上有立法规定,再次强调,如果任何东西被视频或音频捕获,你实际上几乎必须准备好编辑它,并准备好公开披露,甚至在它被用于潜在调查之前。
所以我们的定价方式是,你可以购买整个套件,或者你实际上可以小试牛刀。通常他们这样做是为了进入预算,证明与我们合作的有效性。所以这是一个例子,意味着我们将继续创新并销售单个定制的、现成的应用程序,这些应用程序能立即带来投资回报,而且他们可以立即引入这些解决方案并以较低的价格出售,但然后他们立即。顺便说一下,这就像有。顺便说一下,这是一个应用切换器。所以一旦你实际安装了它,你实际上可以打开一个新的应用程序,无需安装任何新东西。这就像访问。你可能在你的电脑上见过,你有Microsoft Excel,直到你扩展你的许可证,你才能打开它。所以这就是愿景。所以我们相信,整套应用程序作为一个包提供,但也可以根据需求或预算限制提供单个定制应用程序,我们认为这也是一个非常独特的产品。
对。所以这是一种低摩擦的方式让人们入门。
摩擦非常低。
哪种方式更容易,无论是应用程序还是。
我们不在乎。这是先立足再扩展,无论你认为哪个应用程序,你可以根据需求获得预算。这也是。此外,一些较大的机构,比如说,过去有其他云承诺的机构。我们可能会打入凶杀案部门。对吧。所以你不必。所以较大的机构,他们不同部门有不同的预算,对吧?
是的。
例如,我们可能不会打入纽约警察局的反恐部门,但我们可能会打入凶杀案部门,如果这说得通的话。
是的。不,这说得通。好的,VDR是你们另一个引人注目的增长机会。或许你可以先解释一下Veritone数据精炼厂(VDR)是做什么的,以及它与竞争对手相比有何差异化。
那么让我们解释一下这是什么。在我的职业生涯中,这种情况发生过几次。当你在一个业务线达到足够规模时,有时会自然出现一个衍生业务线。我的意思是,正如我们所说,十多年来,我们一直在大规模摄入和索引音频和视频。我们说的是数千万小时。那是哥伦比亚广播公司新闻,那是ESPN。那是随身摄像头 footage,那是安全录像。通过我们的系统,我们正在分解这些内容,对数据进行标记化,并创建我所说的所有这些音频和视频的高精度索引。显然,大型语言模型和基础模型的现象已经出现。对吧。显然我们都知道发生了什么,现在我们正在使用ChatGPT 5.0等。这些模型需要训练数据,大量的训练数据。不仅是为了正在构建的新基础模型,也是为了对它们进行调优。这现在是一个数十亿美元的行业,意思是投资于训练数据以训练这些模型或继续改进这些模型的行业。随着模型变得更加复杂。最初的模型,大型语言模型,谷歌的Transformer模型,显然还有ChatGPT2,它们主要是在文本上训练的。
随着模型变得更加复杂,基础设施变得更加负担得起和高效,他们开始在图像上训练这些模型,现在是视频和音频。目前,对于那些正在构建这些基础模型的知名大公司来说,对音频和视频的需求非常高。现在看看Veritone多年来一直在做的事情,我们坐拥着,对吧,巨大的所谓储备。可以把它看作是石油储备。巨大的音频和视频石油储备,这些已经被摄入、标准化、清理,在很多方面我们已经对其进行了标记化。所以它几乎是人工智能模型训练就绪的。
所以这是一个有机的过程。所以实际上,我们在这方面并不陌生。像Shutterstock等其他公司多年前就进入了这个业务,开始主要向这些模型开发公司授权图像。这是我们在2024年第四季度真正以测试版推出的东西。现在这是我们增长最快的业务线之一。今天对我们来说这是一个数百万美元的业务线。我们没有将其作为特定细分市场单独列出,但我们现在几乎向每个超大规模企业销售。我们预计在可预见的未来,除了公共安全之外,这将是我们业务增长最快的领域之一。
所以再次强调,我们具体在做的是,我们处于这个等式的两边。我们与数据供应商有合同。所以哥伦比亚广播公司新闻、NCAA、肯塔基大学实际上是我们的数据合作伙伴,对吧?他们的安全摄像头录像。对吧。我们并不真正关心数据集是什么。我们是音频和视频方面的专家。所以我们有合同,其中大部分在数据方面是独家的。然后我们也与买方有合同。那些是模型开发公司,超大规模企业。所以我们有这种优势,我想说我们拥有非常独特的专业知识。
很少有公司处理过我们这么多的音频和视频,也许AWS。另一家公司是英伟达,据说有2000万小时的自然视频等训练档案。所以我想说,使其独特的是,第一,我们绝对是音频和视频方面的专家。第二,我们拥有经过尝试和验证的技术栈,能够处理和准备这些音频和视频,将其实际转化为可靠的训练数据。第三,这不仅仅是技术问题。
我们所做的一切,我们也是业务专家。你必须知道,到处都有诉讼。你们拿起报纸就能看到有人因为有人窃取别人的数据集来训练他们的模型而被起诉。我们在帮助进行这些业务谈判方面也是专家。所以再次强调,可以把我们看作是几乎全方位服务的,这在该领域非常独特。
或许你可以快速谈谈VDR的商业模式相对于有人购买aiware平台是如何运作的。这可能有助于人们理解。
那么让我们以一个客户为例,使其更容易理解。哥伦比亚广播公司新闻是我们的大客户。哥伦比亚广播公司新闻现在扩展了业务,大多数哥伦比亚广播公司的业务都购买我们的软件许可证。我们的软件用于索引他们所有的音频和视频,不仅是他们的历史档案,如阿波罗登月 footage,还有他们做的所有事情。每个地方电视台,他们制作的每一段内容都通过AIware进行索引和组织。所以再次强调,第一部分是他们付钱给我们来为他们做这件事。作为SaaS解决方案,我们现在也扩展了这种关系,他们成为了VDR客户。
所以现在实际上我们拥有获取该数据、准备数据并将其营销和销售给模型训练公司的独家权利。我们控制整个生态系统。第一,当我们授权软件时,技术方面更像是传统销售,并且利润率要高得多。所以再次强调,我们关注的是我们正在索引的音量、我们如何处理数据以及向哥伦比亚广播公司新闻返回的语义价值。他们按月支付我们经常性的SaaS费用,更传统的SaaS模式,VDR方面是基于消费的,通常是收入分成。
举个例子。如果购买数据的单位经济是,比如说,100万美元的交易。如果我们很快产生50万美元的费用,我们会从顶部收回所有准备数据的费用。所以这意味着我们保留这部分并带有少量利润,然后我们与哥伦比亚广播公司新闻按收入分成剩余部分。所以实际上,第二部分,VDR对哥伦比亚广播公司来说是一个创收解决方案,而不是成本中心。这说得通吗?所以实际上,如果你从净净值的角度来看,这真的很令人兴奋,哥伦比亚广播公司现在实际上正在赚钱。
对吧。不仅仅是他们使用我们软件做的其他事情的剩余收益。现在与Veritone的主要关系是一个创收解决方案,尽管他们仍然在SaaS基础上授权并向我们付费。所以非常概括地说,我们现在VDR的大部分业务是基于消费的,而不是经常性的SaaS基础。
明白了,非常有帮助。
这与我们历史上的SaaS业务有明显的区别。
是的,绝对。或许只是为了澄清,你提到的VDR的数百万美元数字,那是年化基础,而不是季度基础。对吧。
交易情况取决于具体情况。所以再次强调,其中一些交易,他们现在就需要数据。所以当我们交付时,就有点像它离开了码头。对吧。如果我们准备好数据,他们删除了它,我们交付了并且他们接受了,我们会在交付时按总额确认所有收入。它不会随着时间分摊。所以再次强调,我们现在VDR的大部分交易流是在我们交付时。我们必须确认,或者必须,我们确实在数据集成功交付和他们接受数据时确认收入。
随着时间的推移,这可能会改变。由于经常性业务,有一些参与者。我们已经与其中一些参与者进行了合作。你可能会开始看到更像SaaS的东西。但再次强调,需要明确的是,VDR业务线主要是基于消费的,通常我们在成功交付数据集时确认所有收入。
关于这一点的最后一点,现金的收取是否与收入确认一致?或者可能会有一点。大卫,
这取决于供应商。我应该说占有现金的条款各不相同。重要的是,在我们收到现金之前,我们对数据供应商不承担任何责任,所以。意思是在我们收到现金之前,我们不会向供应商预付现金。
明白了。好的,非常有帮助。好的,去年VDR有很多行业发展,特别是“创世纪计划”、白宫的行政命令。最近,迪士尼宣布与OpenAI达成授权协议。或许你可以谈谈这些以及其他任何相关行业事件对VDR业务的影响。
我认为这里的宏观情况是模型本身、算法、大型语言模型,人们可以对此争论,正变得更加商品化。有数百种多模态基础模型。我们不成比例地使用其中的少数几个。但再次强调,由于训练和推理成本的降低等原因。有很多新公司正在创建新模型,第一点。所以现在正在发生的是,如果你阅读行政命令,这些模型之间的很多差异在于训练数据的质量、范围和一致性。
所以,意思是训练数据现在正成为差异化因素。所以你们都看到了这一点。如果你看这些大型语言模型或多模态模型的性能改进,它们正变得更加微观,也就是说它们不像宏观那样。如果你看到他们试图玩GONG或其他应用程序的测试分数,你会看到阶跃式改进正在缩小。这主要是因为你没有看到底层算法模型本身有相当大的进步。质量的差异被称为减少幻觉,或者对于我们生成图像或视频的人来说,是输出的质量。
其中很多取决于训练数据本身。所以你刚才提到了两个完全不同的行业,总统的行政命令,美国将开始建立我们自己的主权模型并拥有它们。显然你在谈论,你举的是一个商业反面的例子,迪士尼与OpenAI达成交易。关键在于商业和联邦政府都意识到了训练数据的重要性。总统的行政命令,创世纪任务,他们明确表示是的,我们将建立并拥有自己的基础模型。
但他们明确表示,使它们与其他国家创建的模型最具差异化的是,他们将利用我们数十年的训练数据,不仅仅是基于文本的数据,还有音频和视频。据估计,我们的政府,无论是通过NASA还是其他领域,坐拥数百,实际上是数百PB的音频和视频。但不幸的是,它们分散在各地。可以把它看作是分散的、孤立的数据孤岛。Veritone处于理想位置,至少在该数据领域成为关键参与者。
我们正在积极参与竞标,成为项目或任务或创世纪任务的参与者,因为他们正在做很多不同的事情。但具体到训练数据方面,我们A我们相信我们可能是音频和视频组件的最佳构建和设计。B,我们正在直接和通过合作伙伴进行竞标。所以意思是有很多人在竞标这个。对吧。你说的是在未来几年,这项计划将投入数千亿美元。
你知道,这正是我们的专长,你知道,没有保证,但可以说我们正在与合适的人交谈,我们直接和通过我所说的合格团队合作伙伴参与其中,我们有很大的机会在未来获得这部分业务的很大份额。
明白了。好的。那么,考虑到VDR的客户群体,或许你可以谈谈2025年到目前为止有多少客户产生了收入,2026年这一数字可能如何变化和扩大,以及我们应该如何看待VDR的最终市场机会。
嗯,再次强调,我们不会公布VDR业务线的客户数量。但我可以说的是,请记住,在VDR中我们有两种类型的客户。我们有代理方。所以数据供应商,这些绝对是客户。好吧。这可能是我们的首要重点。需要明确的是,即使有。我马上会谈到买方方面。但在代理方方面,哥伦比亚广播公司新闻,我们将发布新闻,谈论我们现在参与的一系列不同的数据供应商。但需要明确的是,这是一类客户。
你们今天拥有的这些客户中,几乎每一个都签订了独家合同,这意味着即使模型开发商直接去找这些客户中的一个,Veritone也必须管理该数据业务。好吧?所以这是一种类型的客户。第二种客户是买方。好吧。可以把它看作是房地产经纪人。你有 listing agent 和买方 agent。那些是超大规模企业。所以再次强调,我们现在与大多数大买家都有合同。但生态系统,如果你按权重计算,如果你按买家的权重计算,现在95%的训练数据支出可能来自50家或更少的公司。
它的右偏程度甚至比这还低。未来几年这里会发生什么变化?我们正在与这些群体中的大多数进行接触。未来几年这里会发生的变化是,我相信今年你会看到这个数字翻倍,并且从现在起三年内可能会比今天大一个数量级,这意味着将会有更多的公司购买或客户购买训练数据。原因是再次强调,托管、训练和运行推理以及利用这些模型的成本正在下降。对吧。
所以这有一个剩余的好处,我们每天都读到的大量投资于数据中心的建设,以及为这些GPU和CPU基础设施供电的费用的降低,正变得越来越便宜,这使得其他你不一定认为正在构建基础模型的企业能够这样做。市场上将会出现很多新名字。有些是已经存在了几十年的非常成功的软件公司,你可能没有听说过。现在你会看到,哦,天哪,他们为什么要构建自己的基础模型是有道理的。
所以再次强调,我们很兴奋,因为再次强调,我认为另一家差异化的公司是我们积极采用针对供应方的商业模式,顺便说一下,其中许多公司在SaaS方面向我们付费,比如哥伦比亚广播公司新闻。但我们也采取非常积极的独立方法与卖方签订合同。
好的,很好。所以你们采用开放平台方法,客户可以引入任何第三方人工智能模型。或许你可以解释一下为什么这是正确的产品战略,而不是像你们的一些竞争对手那样采用闭环系统。
嗯,好消息是我可以引用我们今天刚刚发布的新闻稿,那实际上是联邦政府的任务,必须是开放的模块化平台。所以我们打赌。对吧。但非常简单的是,你知道,我们从aiware创立之初的愿景就是,将会有数百万种不同的模型,而且有。让我们把它们分为两类。认知模型,认知模型可以看作是一种调优模型,可以寻找你的脸。对吧。它只做这一件事。我可以运行音频,我可以运行视频通过它,它只是在寻找乔希的脸。
或者你有,我称之为大型的,可能不太准确的生成式人工智能模型。对吧。多模态模型,我可以通过ChatGPT运行。你可以在ChatGPT中上传一段视频,你会对视频有一个大致的了解。但如果你试图将其精确到毫秒,把它看作一个案例。对吧。有些模型实际上是为了对视频智能或视频理解有大致了解而设计的。但如果你试图在一定时间内大海捞针。所以如果我要起诉一个案件,我必须分析,比如说25个不同的摄像头,因为一个潜在的嫌疑人正在摄像头之间移动,你需要结合认知人工智能和生成式人工智能,如果你明白我的意思。
你想要每项工作的最佳模型,对吧?如果我想要最好的训练模型来找到乔希,或者我想要最好的训练模型来识别AK47步枪,我只是举个例子。所以当你考虑构建基础设施时,aiware的设计专门用于有效地上传和运行任何类型的模型,并标准化数据输出。现在,例如,iHeartMedia,多年来一直是我们的客户,在不改变他们的应用体验的情况下,我们已经更改或更新了他们的转录和情感分析模型约100次。他们甚至不知道发生了什么。
所以关键在于,最终我们将开始谈论AIware几乎像一个无处不在的工具,一个输入函数,然后回到我们提供的解决方案、应用程序和价值。你只能通过开放架构或平台和模型无关的平台来做到这一点。所以再次强调,把它看作是你想要拥有最优秀、最聪明的头脑,也就是模型供你使用。现在,需要明确的是,我们的客户在公共云中可以运行的模型可能与我在空气隔离环境中放入的模型不同。
你我使用的很多模型,它们只在商业云中运行,对吧?你不一定能在空军的空气隔离环境中运行某些ChatGPT模型或调用它们。所以我们的另一个独特优势是我们领先于这一曲线。所以当我们将整个aiware栈部署到空气隔离的网络隔离环境中时,我们的设计已经考虑到我们可以使用不同的模型子集或你们从未见过的模型,因为这些模型实际上是被拥有的。
对吧。并且由美国政府训练。对吧。顺便说一下,你们永远不会看到它们。我们甚至永远不会看到它们。对吧。一旦我们部署了它,我们甚至不知道他们在运行什么模型。
对。
AIware平台再次接受这一点。所以可以把它看作是他们自己训练并在AI上部署。我们在他们自己的基础设施上。所以可以把它看作是同类最佳。
明白了。[突然结束]