英伟达&大摩会议刷屏!英伟达CFO:AI基础设施市场规模可达2万亿美元,英伟达不仅是硬件公司(组图)
3月5日晚上,英伟达&摩根士丹利TMT会议爆火出圈,英伟达CFO Colette M. Kress的一系列精彩观点刷爆各大投资人群聊。
会上,Kress表示,看到了AI和加速计算的巨大商业潜力,预计AI基础设施市场规模将远不止现在的1万亿美元。她补充称,英伟达首席执行官黄仁勋曾在一次路演中表示,该市场规模可能接近2万亿美元。
Kress还提到,英伟达不仅仅将自己定位为一个提供AI芯片的硬件公司,而是一个为数据中心提供整体加速计算解决方案的公司。随着更多产品的推出,英伟达的毛利率可能会回落到75%左右的水平,这是因为公司目前处于H100推动增长期后的产品多样化阶段。
针对推理业务贡献公司40%收入的疑问,Kress表示,英伟达拥有庞大的推荐引擎和搜索基础,考虑到生成式人工智能正处于早期发展阶段,公司推理业务将会持续增长。(新的GenAI,尤其是多模态、新的更强大模型带来的更广泛应用,是未来的关键)
数据中心之外,英伟达还将目光转向了个人电脑和工作站。Kress表示,未来模型不仅能存在于云中,笔记本上也能部署较小的LLM。
Kress还提到,英伟达正将产品创新周期从2年缩短至约1年,这种程度的加速不仅是竞争对手难以匹敌的优势,也是公司为未来潜在的加速创新做准备。
精彩观点
(加速计算)的变革即将到来。这种变革是关键的,因为摩尔定律已经走到了尽头。新的平台将有必要推动加速计算,并可能在未来几十年内与我们同在。
每个季度,我们都有同样一个任务,那就是为客户增加供应,我们做到了这一点。即使进入今年,我们也会继续这种做法。
随着我们未来将推出更多种类的产品,可能会回到H100推出前的水平,即毛利率在75%左右。我认为这是个合理的水平
确实有很多被浪费的电力。这些浪费的电力曾被用于低效的数据中心建设,可能需要彻底重建。
当你考虑到下一代产品的可用性,以及供应可能会紧张时,但同时也要考虑认证周期时,最棒、最先进的产品仍然是H100。
在全新的隐私时代,营销需要进行全面重塑,这里推荐引擎扮演着非常关键的角色。搜索也是另一项非常重要的工作......生成式人工智能才刚刚开始。我们拥有庞大的推荐引擎和搜索基础,基于定义,推理可能会持续增长。
模型可能不仅存在于云中。电脑、笔记本电脑中可能会有一个较小的模型。某些创意工作者可能会在他们的工作站中建立一个单独的模型。
...我们将架构周期从2年缩短到1年...但即使在同一架构内,我们现在也有能力推出其他关键产品,以满足市场的某些需求。H200就是一个例子,它是在H100的基础上构建的。
即便只是考虑将现有的1万亿美元基础设施转型,对我们来说这就已经是一个1万亿美元的机会。而且,AI在加速计算中的应用,不仅可以提高效率,还能创造新的价值,市场规模可能会超过现有基础设施.....黄仁勋在一次路演中提到,市场规模可能接近2万亿美元,不仅仅是1万亿美元。
在我们看来,英伟达不仅是一个提供加速器的(硬件)公司,而是一个致力于数据中心加速计算的公司。因此,我们相信市场潜力更大。
Colette M.Kress 执行副总裁兼首席财务官
Joseph Lawrence Moore 摩根士丹利公司研究部、执行董事
Joseph Lawrence Moore:
太好了。欢迎大家回来。我是Joe Moore。非常欢迎英伟达首席财务官Colette M.Kress。我想快速阅读一下研究披露。有关重要披露信息,请参阅摩根士丹利研究披露网站,网址为morganstanley.com。如有任何疑问,请联系您的摩根士丹利销售代表。
Colette,在我们开始之前我开了个玩笑。我不知道你现在是怎么过日子的,因为我的生活有那么大一部分被英伟达占据了。而且这里还有30个像我这样的人,你是其中一个,你还是英伟达的CFO,所以一定非常繁忙。非常感谢你百忙之中来到这里。
也许我们可以从这里开始。你去年也来过这,当时我们刚刚开始了解ChatGPT对整个(AI)生态系统的重要性。英伟达当时的数据中心收入为40亿美元,现在即将达到每季度200亿美元的水平。我并非是在恭维,但确实接近每季度200亿美元。
你们是如何在1年内实现这一目标的?我的意思是,你一年前坐在这里时,有没有考虑过这种可能性?
黄仁勋是否说过:“嘿,我们要为可能出现的每季200亿美元需求做好准备?”就像你是怎么做到的?你是如何满足这一需求的?
Colette M.Kress:
所以我也必须做一个简短的开场声明。作为提醒,这个演讲包含了前瞻性描述,建议投资者阅读我们提交给SEC的报告,了解我们业务面临的风险和不确定性。
让我们回到一年前。那真是何等非凡的一年,我们正处在一个激动人心的时期。是的,这是一个繁忙的时期。但可能,即使在一年前我们站在这个舞台上时,也有着完全不同的视角。我认为当时生成式人工智能的推出仍处于一个探索阶段,人们正在了解什么是ChatGPT,以及人们如何使用它。
从我们的角度来看,它是一个重要的产品。我们了解OpenAI,我们已经与他们合作了好几年,了解他们的工作成果。我们可能只是将它视为我们在深度学习、GPU推理应用的整个旅程中又一个重要的组成部分,而现在它是一个非常重要的大型语言模型(LLM),我们一直在从事这方面的工作。
但情况肯定发生了变化,因为我们感兴趣的是世界各地的关注程度。当你说世界各地时,每个国家、每个企业、每个消费者、世界上每一位CEO都对AI可以做什么有了很深入的理解,无论是从为他们创造收入,还是从提高企业效率和生产力的角度来看。
但从我们公司的整体目标来看,我们在过去十几年里一直专注于加速计算。这可能已经有15年了,我们的整体使命是帮助人们理解(加速计算),变革即将到来。这种变革是关键的,因为摩尔定律已经走到了尽头。新的平台将有必要推动加速计算,并可能在未来几十年内与我们同在。
人工智能恰好成为了推动加速计算初期使用的杀手级应用。因此,我们日以继夜地致力于扩展我们的平台、系统和软件,以及我们为未来数据中心所能做的一切。但我们对此无比高兴,我们将其称为一个转折点,生成式人工智能是这项工作的重要组成部分。
Joseph Lawrence Moore:
太棒了。也许我们可以谈谈需求方面,但在此之前也许你可以谈谈你是如何实现如此迅速的增长的。我的意思是,我越来越多地与非半导体投资者讨论英伟达的事务。当你考虑到要在这种规模、复杂程度的企业中实现4到5倍的增长时,这确实非常了不起,你需要使用所有专门的多芯片封装工艺等。我们看到有些公司在类似情况下受到供应约束,增长40%或50%。
那么英伟达是如何做到的呢?是如何实现如此激进的扩张?我稍后会谈到一些人们对你最终追上需求的供应链焦虑。你是如何看待这一点的?我的意思是,最终是在努力追上需求。
Colette M.Kress:
正确。因此,关注供应扩张,我们不得不从多个角度入手来增加供应。这并不是一蹴而就的。多年来,我们一直在谈论未来供应链所需的弹性和冗余性。所有企业在扩张时都必须考虑到这一点。这只是比我们预期的规模来得更早一些。但我们仍然利用了我们一直在努力建立的基础。
第一,请记住,我们的许多供应商和合作伙伴已经与我们合作了几十年。首先是,谁先打电话给谁?双向沟通都有。他们说,我们如何帮助你扩大现有供应商的产能,如何帮助你从新的供应商那里增加供应?但我们也在寻找新的供应商,以便为我们正在进行的工作提供更多构建能力。
最后,我们着眼于缩短制造周期,分解并寻找我们能够更快将库存投放市场的方法。在一年的时间里,我们已经取得了长足的进步。每个季度,我们都有同样一个任务,那就是为客户增加供应,我们做到了这一点。即使进入今年,我们也会继续这种做法。所以我们对这项工作感到非常满意。
Joseph Lawrence Moore:
谢谢。你看看目前的环境,你觉得你已经接近满足需求了吗?在这个背景下,人们非常关注交货期,找到这个问题的答案。但还存在供电和机架空间等问题,你的客户也在处理这些问题。在许多情况下,这些都没有跟上你提供的供应。似乎对GPU的最终需求仍然很强劲且得不到满足。那么,就你对满足这种需求的程度,你有何看法?
Colette M.Kress:
是的。我们在大约一年前就面临着这种需求。人们并没有说他们在某一天需要这些,而是提前排队,排队是为了在可预见的时间内满足他们想要的需求。我们正在满足其中相当一部分需求。但请记住,这在很大程度上取决于我们推出市场的一款非常重要的产品,即H100。H100在我们的平台架构中取得了真正的成功。但请记住,我们还有新产品即将推出市场,这将进入供需管理的下一个阶段。
我可能会在稍后详细讨论这一点。但我们的重点是保持供应与需求相平衡,同时在我们推出这些新产品时,帮助客户理解构建这些产品和将其部署到数据中心的需求。
回顾一下,当时租用一个数据中心,或者说,一个未配备的数据中心建成后,可能需要一年时间来布置数据中心内部的一切,并准备就绪。规划流程是漫长的,因为你还必须考虑在新产品推出时会有哪些变化?我该如何考虑数据中心的电力?我该如何考虑数据中心的整体配置?我们最出色的客户和数据中心建设者已经在为未来几年内的加速计算转型做准备,并使所有这些保持一致。目前情况良好。
确实有很多被浪费的电力。这些浪费的电力曾被用于低效的数据中心建设,可能需要彻底重建。这可能是他们想要做的第一件事。但从长远来看,确保未来数据中心的电力供应将是一个关键需求。是的,我们的顶级客户已经在着手解决所有这些问题。
Joseph Lawrence Moore:
在上次电话会议上,黄仁勋确实曾提到其中一位超大客户,延长了传统服务器的折旧周期。你也谈到,在某种程度上,英伟达正在取代对传统服务器工作负载的需求,或者为传统服务器创造了一个传统环境。这是真的吗?或者人们只是希望升级服务器,但他们需要首先关注这个问题?现在你觉得你正在与传统服务器工作负载竞争吗?这只是预算问题,还是功能问题?
Colette M.Kress:
是的,这是一个非常好的问题。目前很难确定它最终会如何发展,但可能会出现多种情况。我们在市场上看到的一些情况是,在过去10到20年里,每年大约有2500亿美元用于数据中心资本支出,这在很长一段时间内都保持相对稳定。但在去年,这一数字首次在很长一段时间内出现了增长。当然,他们的关注点是加速计算,但你也看到了他们延长现有x86服务器使用寿命的做法,允许这些服务器继续运行,但不一定要升级。
当你思考资本的利用时,所有公司都会考虑他们将获得何种投资回报率。他们可能会优先考虑最重要的项目。对他们而言,目前最重要的项目是在人工智能领域保持竞争力。所有公司都会嵌入人工智能技术。因此,人工智能已成为他们资本支出的一个非常重要部分。
问题在于,他们是否会继续一些非高回报类型的投资?这可能不会发生。这将是第一件被更高效率的解决方案所取代的事情,例如加速计算和人工智能。因此,我认为,未来你会看到这种情况。
Joseph Lawrence Moore:
这很有帮助。谢谢。你在电话会议上提到,当新产品推出时你可能会供不应求,你无法满足所有的需求。显然,你已经正式宣布了H200,但你还有其他尚未宣布的产品。但我想黄仁勋在一些新闻报道中透露了一些信息,称我们在下一代产品上也会供不应求。你能谈谈这方面的情况吗?在这些尚未公布的产品推出之前,你是怎么预见到人们会对它们供不应求的?
Colette M.Kress:
是的。我们经过数十年架构产品上市的过程改进,其中一个重要环节就是与我们合作了10多年的主要客户保持密切联系。在新架构的初期阶段,这对他们来说并不是一个意外,因为我们都在了解他们的需求,以便将这些需求融入我们的架构。其次,他们对即将推出市场的产品的规格和采样情况也有一个很好的理解,即便是在早期阶段。
我们还很好地了解了他们对需求的预期水平。这对于我们在启动新架构时了解他们的需求是有帮助的。这就是黄仁勋说供应非常紧张的原因,换句话说,需求可能会超过我们最初的供应。所以我们再一次开始着手满足摆在我们面前的那些需求。
Joseph Lawrence Moore:
太棒了。我知道你很快就会对这些新产品有更多介绍,但根据你所做的所有营销活动,以及我们从客户那里听到的反馈,这些产品似这些新产品似乎非常不错。那么,在临近新产品发布时,你如何考虑过渡呢?当B100、B200等非常吸引人的新产品出现时,你认为旧产品会有停滞的风险吗?还是你觉得你已经知道所有H100都会去哪里,作为一个临时阶段?
Colette M.Kress:
是的。这涉及到我们将架构周期从2年缩短到1年的工作。但即使在同一架构内,我们现在也有能力推出其他关键产品,以满足市场的某些需求。H200就是一个例子,它是在H100的基础上构建的。
我们一次次看到,当你使用某个架构时,并且继续使用该架构,你就必须在系统、软件和安全性方面对其进行认证,这是他们流程的一个重要部分。这种持续性对于许多人而言将是一个重要的需求周期。现在大家对H100的想法是,这个房间里、这个城市里有很多人甚至还没有接触过H100,所以即使我们推出新产品,获得H100的机会对于那些已经构建的集群以及那些尚未启动的集群来说仍然非常重要。当你考虑到下一代产品的可用性,以及供应可能会紧张时,但同时也要考虑认证周期时,最棒、最先进的产品仍然是H100。
Joseph Lawrence Moore:
太棒了。再次就你提到的那些还无法满足需求的客户作一个跟进。我的意思是,你已经谈到了政府买家、非传统企业软件买家。很明显,一个主权国家肯定希望拥有自己的硬件,而不是在公共的云上构建。现在有一个全球地区已经有好几个月不允许从你这里购买产品了。那么,你能概括一下这种未得到满足的需求来自哪里?当你提到世界上每一个政府都想做这件事时,这是夸张的说法吗?还是你真的看到了这个层面的需求?
Colette M.Kress:
是的,有许多不同领域的独特需求。那些我们尚未触及的行业。我们在医疗保健、金融服务、汽车、制造业等领域有非常牢固的联系。但我们也看到,各个企业软件公司都在推进生成式人工智能的应用。
因此,仍有大量来自美国公司的需求。我们已经谈到了主权人工智能,以及OpenAI和ChatGPT带来的独特视角。ChatGPT是美国本土的。它使用的是美国语言,美国文化、美国行话贯穿其中。许多其他国家都希望拥有自己的文化、自己语言的东西。因此,在这些地区构建LLM的工作受到了主权国家的推动,这一点非常重要。
你会看到一些企业有兴趣在此基础上构建自己的LLM,并在企业层面上开始应用。因此,这种来自新兴企业、主权国家的兴趣成为了一个重要的流向。我们对此有一个相当大的项目通道,并与他们合作,因为他们还没有达到像我们在美国这样的计算能力水平。
因此,我们将继续为这些新企业、主权国家大力建设,同时也为我们的合作伙伴带来符合他们期望的产品。
Joseph Lawrence Moore:
好的。太棒了。你在本季度财报电话会议上说,有40%的收入来自于推理业务。这实际上是我在本季度之后被问及最多的问题,因为我们处于实际使用这些模型的相对早期阶段。像这样的数字似乎意味着,在相当长的一段时间内,推理的增长前景是非常明确和强劲的。但你是怎么知道的呢?正如我与云计算业务的员工交谈时所说,他们认为这只是一样的GPU,我们不确定其中有多少是。而你在电话会议上说,这是一个估计,但你认为这是一个保守的估计。也许你可以就这40%的数字多谈一谈?
Colette M.Kress:
是的,这对我们来说是一个非常好的问题。我不希望你马上就表现出吃惊的样子。但我们所做的工作实际上是帮助人们理解,我们最强大的系统,并且我们理解我们与合作伙伴公司的工程师之间进行的工作。因此,我们真正地去研究了我们与许多客户合作的所有项目,并能够对他们的使用案例进行分类。
所以我知道,我们目前处于生成式人工智能的早期阶段,人们可能仍在构建LLM。有些公司已经进入了变现阶段,比如Copilot。但创建LLM最重要的一点是推荐引擎,推荐引擎助力了这个房间里每个人手机上的各种应用,以及他们在新闻、购物、餐馆等领域的工作重塑。
在全新的隐私时代,营销需要进行全面重塑,这里推荐引擎扮演着非常关键的角色。
搜索也是另一项非常重要的工作,我理解人们对生成式人工智能的兴奋,但它仍然是一项巨大的工作。我们所做的工作是关注未来的推理。不是过去30年的原型二进制响应式推理,而是理解需要毫秒级响应的大量数据。我们知道,我们将在这个市场中扮演非常重要的角色。但生成式人工智能才刚刚开始。我们拥有庞大的推荐引擎和搜索基础,基于定义,推理可能会持续增长。
Joseph Lawrence Moore:
当我们在这个会议及其他场合听到云计算公司谈论降低每次查询的成本是他们的一个重要目标时,这是否意味着人们将转向英伟达?或是远离英伟达?我们应该如何看待这种动态?因为在进行这些推理时使用英伟达芯片的是非常昂贵的,但显然效率也很高。
Colette M. Kress:
必须对成本进行一些分解。他们需要考虑的成本不仅仅是系统的成本。他们需要考虑的是生产总成本。例如,在疫情期间,人们关注的一个最大领域就是研究他们的电费账单,了解有没有浪费电力的地方,即使那里实际上没有运行机器。使用英伟达的系统、工程、软件和电力使用都是最高效的推理解决方案。这就是人们转向英伟达的原因。
它不仅能具有出色的响应率,而且在实现这种响应率的同时,能源效率也是最高的。功率先是会上升,但在运营过程中会很快下降。因此,你必须考虑系统的整体拥有成本以及所有相关的因素。你不能仅仅关注芯片的价格,这是不正确的。
Joseph Lawrence Moore:
好的,这确实很有帮助。谢谢。还有一些其他的数字。你提到了网络,我相信现在运营率达到130亿美元。这并不令人惊讶,因为上一季度你也提到过100亿美元的运营率。但这仍然是一个非常惊人的数字,因为我们看到一些你的半导体竞争对手对约10亿美元的网络机会感到很兴奋。而看起来你在网络处理器领域像在处理器领域一样占据主导地位。那么,你能谈谈这个数字及你对其持续增长的预期吗?
Colette M. Kress:
是的,这确实是一项了不起的工作。Mellanox团队与英伟达合作,为数据中心计算添加了一个专注于网络的重要模块。我们不仅可以且确实拥有进行加速计算和处理的最佳系统和处理器,但如果没有高质量的网络系统,实际上就耗尽了计算所能实现的成功。
因此,在并购之后的这几年里,我们一直在通力协作,了解我们能够做些什么来将网络融入我们的工作中,主要关注流量模式和速度。数据中心内部的流量模式在推理阶段至关重要。无论是从东、西、南、北,流量模式都至关重要。
我们的InfiniBand平台一直是人工智能和加速计算集群的黄金标准。因此,当我们销售数据中心计算架构时,我们也经常将它们打包销售,这是一个延续。
我们还有新的产品即将上市,包括Spectrum-X。Spectrum-X旨在关注以太网。以太网在许多企业中也是一个重要标准。所以现在,我们可以在以太网阶段获得与InfiniBand相同的好处。我们对这些即将推出的产品感到非常兴奋。
Joseph Lawrence Moore:
太棒了。那么怀疑论者的回应是,你存在短缺,你在捆绑销售,你......这并不像我们所看到的那样。就像网络方面也存在未得到满足的需求一样。
Colette M. Kress:
当所有美好的事物出现时,在某个时候都会遇到一些挑战,以创造这些伟大的产品。显然,这些并非是商品产品。有时,我们的光缆需求可能很高。但我们认为,通过我们创建的供应商和合作伙伴,我们已经解决了大部分问题。
Joseph Lawrence Moore:
好的。太棒了。你还提到软件和服务业务首次达到10亿美元的规模。你能谈谈这是怎么回事?主要组成部分是什么?
Colette M. Kress:
是的。我们很高兴软件、服务和SaaS业务在去年年底实现了10亿美元的年度水平。主要组成业务是英伟达AIE,既可以单独出售,也可以与我们的主要平台一起出售。这对企业来说是很重要的。你还会看到我们在SaaS层面上用 DGX 云所做的工作。你还会看到我们为许多系统提供的服务,包括人们构建模型、使用 NeMo、BioNeMo 以及我们为整个系统提供的总体支持。
我们拥有大量的软件解决方案。这将再次成为未来的一个重要增长点,因为我们在未来将推出汽车软件,将与我们在汽车领域的整体基础设施一起出售。Omniverse也是一个很棒的产品。随着生成式人工智能的发展,企业对软件许可的需求将会增加,以确保软件保持最新、具有新功能、确保安全性,因为我们将继续在企业领域增长,AIE 也将变得非常重要。
Joseph Lawrence Moore:
太棒了。关于服务方面,我收到很多关于 DGX 云的问题,你们本质上是与超大规模云服务商合作,提供基于云的服务。人们关注的问题是,你们在这个业务领域的追求有多大?其次,一些超大规模云服务商是否会对英伟达可能与他们竞争这一点感到焦虑?
Colette M. Kress:
是的。我想在谈及我们的云服务提供商合作伙伴时,要用正确的语气。他们正在为企业构建出大规模的多租户计算环境,在这方面他们拥有极大的专长。当他们与企业讨论软件时,这是一个很好的机会,他们可以说:"我可以介绍你认识一下 英伟达,让他们来帮助你解决软件方面的问题吗?"所以这是一个双赢的局面。云服务提供商搭建计算环境,而我们则提供整体软件解决方案。
云服务提供商、客户、英伟达都很满意,英伟达销售并与软件方面建立关系。目前就是这样运作的。
你也可以反过来,客户可以直接与 英伟达 合作,在软件、服务和解决方案方面进行合作,无论他们是在构建LLM,还是想在其LLM的基础上构建应用程序。
但请记住,我们已经为云服务提供商采购了计算资源。因此,云服务提供商仍然可以获得这部分业务收入,而我们只是在我们的平台上直接与他们合作。无论哪种方式,对他们来说都是很棒的解决方案。
Joseph Lawrence Moore:
太棒了。也许你可以谈谈竞争,因为我感觉每周我们都会收到来自你的超大规模云服务商关于定制硅的新闻稿。还有许多初创公司。你有 AMD 和英特尔这样的商用产品似乎也获得了一些收入份额。你是如何看待所有这些的?你是更专注于击败竞争对手,还是更专注于英伟达自身的发展?
Colette M. Kress:
我们的关注点与许多其他公司完全不同,因为他们关注的是硅或为某种工作负载设计的特定芯片。
让我们退后一步来理解英伟达作为一家平台公司的整体愿景,这是一家能够为未来的任何数据中心计算提供解决方案的公司。创建平台与创建芯片是完全不同的过程,我们的重点是确保在任何数据中心级别,我们都能提供不同的组件,无论是计算基础架构、网络基础架构还是整个内存部分。我们可以组装成一个完整的超级计算机。
所以这就是我们的业务,它带来了一个端到端的软件栈。这套软件可以确保,在人工智能不断发展的任何时候,人们都需要深入开发阶段,比如 CUDA,以确保他们与人工智能的最新发展保持同步。但它也为他们提供了 CUDA DNN 用于深度学习网络、NeMo、BioNeMo,以及 SDK、API 和一整套与我们的数据中心基础设施完全集成的端到端解决方案。因此,我们的市场定位和解决方案与其他公司完全不同。
我们会不时看到一些简易芯片问世。没问题。但请始终记住,客户必须权衡使用这些芯片的整体拥有成本。现在,有一群开发人员专注于 英伟达 平台,这是一个非常庞大的开发人员群体。开发人员希望在有其他开发人员的地方花时间。因此,当你考虑到其他一些硅产品时,你必须说服开发人员相信,在这方面投入时间是一个好主意。这不仅仅是芯片的成本,而是整个拥有成本的问题。
Joseph Lawrence Moore:
太棒了。我还有一些其他问题,然后我留给观众提问。人工智能在边缘的另一个关注焦点是什么,人们已经将其视为一个与英伟达不同的机会。但你们在这一领域确实有大量活动正在进行。你们在机器人领域有黄仁勋,而且汽车领域的很多活动最终也会转向边缘人工智能。你能谈谈你们如何看待边缘机会以及攻击这一领域的能力吗?
Colette M. Kress:
是的。有一种想法认为,并非所有事情都会发生在数据中心。从自动驾驶汽车和汽车领域来看,我们当然早就意识到,一些事务处理需要在汽车内部进行。你可能也会在机器人领域看到类似的情况。我们有一个机器人平台 Jetson。我认为,在接下来的几周的 GTC 大会上,围绕这一领域的一些重点将是一个很好的思考。
但我也想把目光转向数据中心之外,思考一下个人电脑和工作站,以及它们将如何发挥重要作用。模型可能不仅存在于云中。电脑、笔记本电脑中可能会有一个较小的模型。某些创意工作者可能会在他们的工作站中建立一个单独的模型。
我们已经看到了对工作站的兴趣和增长,以便他们可以在实际部署到数据中心之前进行初步工作。那么,人工智能会在哪里发生交易呢?是的,在云端。但你也会看到关键设备上的应用,如汽车和机器人,这些是非常好的例子。
Joseph Lawrence Moore:
太棒了。不过,我还有更多关于数据中心的问题,但我想问一个财务问题,然后再开放提问环节。
你显然认为英伟达短期内毛利率非常好。但你预计在下半年它会下降。你能谈谈这一点吗?这是出于谨慎考虑,不希望被一个非常高的毛利率目标所困扰?还是你认为,我们必须追求某些会降低毛利率的事物?
Colette M. Kress:
是的。我们第四季度的毛利率达到了75%,我们对第一季度的指引也处于同样水平。
我们成功地推出了H100产品,通过与其他供应商合作,提高了我们的毛利率。但是,随着我们未来将推出更多种类的产品,可能会回到H100推出前的水平,即毛利率在75%左右。我认为这是个合理的水平,当然,我们将对产品组合的具体构成进行讨论。这是我们的计划——产品组合将会有所不同,H100带给我们巨大成功,我们成功地完善了其制造过程,降低了成本。
Joseph Lawrence Moore:
很好,看看是否有观众提问。
未知分析师:
我们非常看好英伟达和黄仁勋领导的AI革命。我有两个问题。第一个关于长期前景,例如,英伟达的一些竞争对手,如AMD和TSMC,已经对未来进行了长期预测,预计到2029年市场规模将达到4000亿美元。
Joseph Lawrence Moore:
2027年,没错。
未知分析师:
2027年。如果借用TSMC的预测,大致为3000亿美元。我们对每个我们分析的公司都非常关注,并非特指您公司。您如何看待长期利润的上升空间?这是第一个问题。第二个问题是您提到的产品创新周期从2年半缩短到1年,这对竞争对手来说是一个巨大挑战。能否谈谈B100、H100等产品?将来是否有可能进一步缩短这一周期?
Colette M. Kress:
对市场规模的各种预测确实有很多,无论是2027年还是更远。我们对市场的看法相对宏观,我们专注于已安装数据中心基础设施,并致力于将它转变为加速计算和AI领域。即便只是考虑将现有的1万亿美元基础设施转型,对我们来说这就已经是一个1万亿美元的机会。
而且,AI在加速计算中的应用,不仅可以提高效率,还能创造新的价值,市场规模可能会超过现有基础设施。处理先前无法处理的数据、以更有效的方式找到解决方案,都将带来巨大增长。黄仁勋在一次路演中提到,市场规模可能接近2万亿美元,不仅仅是1万亿美元。在我们看来,英伟达不仅是一个加速器公司,而是一个致力于数据中心加速计算的公司。因此,我们相信市场潜力更大。
未知分析师:
在之前的财报电话会议上,黄仁勋谈到了多模态推理。您观察到对多模态推理的需求如何?例如,我们已经见识到了文本到视频的应用。您如何看待这作为推动推理需求增长的一个手段?作为投资者,我们关注的是需求增长的趋势。这是第一个问题。第二个问题是关于政府支出,您现在看到推理在其中占比多少?还是主要集中在训练上?谢谢。
Colette M. Kress:
谈到推理,这是个很好的问题。正如我们之前讨论的,推理占总需求的40%,未来增长依然可观。我们关注的推理领域不限于标准数据外,视频以及其他新兴领域,如推荐引擎和生物学应用,都是我们的关注重点。至于政府(人工智能)支出,初期更多集中在训练上,特别是在自然语言处理和本地化领域。为一个国家或地区构建大型模型是初期的主要任务。在美国以外,政府资助与企业共同努力,两者都有所涉猎。当然,训练完成后,应用开发和解决方案定制也是关键。
Joseph Lawrence Moore:
很好,我们的时间差不多了。Colette,非常感谢您的分享。
Colette M. Kress :
感谢大家。