黄仁勋:他如何用AI一颗子,打吃3000亿美元的云棋局

发布时间:2023-12-24 16:26:05来源:佚名

在英伟达8月23日的电话会上,所有人的目光都集中在由GPU服务器带来的惊人营收,H100出货量明年翻倍的豪言壮语上。英伟达的另一项今年三月才推出的业务也被投资人问及,但并没有太受关注。实际上,这一业务静水流深,

在英伟达8月23日的电话会上,所有人的目光都集中在由GPU服务器带来的惊人营收,H100出货量明年翻倍的豪言壮语上。英伟达的另一项今年三月才推出的业务也被投资人问及,但并没有太受关注。实际上,这一业务静水流深,正在缓慢改变着一个3000亿美元的市场。而老黄在正是在这个业务中布局着英伟达的下一个十年。从这个业务中我们还可以看到,英伟达怎么利用AI热潮做撬杆,把一家硬件公司带向真正的科技帝国。

黄仁勋:他如何用AI一颗子,打吃3000亿美元的云棋局

黄仁勋借势下棋

去年,英伟达向亚马逊云服务AWS和其他云服务提供商提出了一项不同寻常的建议:英伟达希望在云服务提供商的数据中心租用英伟达芯片驱动的服务器,然后再将这些服务器转租给人工智能软件开发商。云服务商长期以来一直是英伟达专用人工智能服务器芯片的最大买家。而英伟达提到的开发商包括全球最大的云计算客户。

一开始谈判并不那么顺滑,但随着一个转机的发生,优势的天平逐渐滑向了英伟达。去年11月,OpenAI推出聊天机器人ChatGPT后,人工智能软件开发商对英伟达服务器的需求激增,云服务提供商很快就无法满足这些需求。在那个微妙的时刻,英伟达看到了一种与云服务提供商争夺客户的方式。英伟达的最大底牌就是其即将发布、备受期待的新人工智能芯片H100,这是传统云服务提供商紧缺的俏货。

据一位直接了解该决定的人士透露,微软、谷歌和甲骨文最终都同意了英伟达的提议,只有AWS表示拒绝。

毫无疑问,在这个过程中英伟达成功利用了其在人工智能硬件(即图形处理单元,GPU)领域的主导地位,以追求一个新目标:通过与其芯片企业用户建立直接关系获得云服务收入。

老黄的这步棋走的非常精妙。AWS和谷歌云的前经理约书亚·伯恩斯坦(Joshua Bernstein)评价道:“这将英伟达置于云服务提供商的品牌之上,此举表明英伟达已经意识到了自己在市场上的地位,以及需要做些什么来保持这一地位!”

这项名为DGX Cloud的云服务是英伟达将其野心扩展到芯片销售之外的最新例证。英伟达最近还开始向Adobe、Getty Images和Shutterstock等客户单独销售与人工智能相关的软件,这些客户表示,他们正在使用该软件构建人工智能模型。英伟达可以利用其与DGX Cloud的客户关系,销售更多此类人工智能软件。

一石三鸟:GPU,你的就是我的

DGX Cloud与其他签约云服务商的合作方式是左手倒右手:英伟达向云服务商租赁自己卖给他们的GPU服务器,然后再加上自己的服务提供给客户。

这么做其实很容易理解。作为硬件提供商,英伟达如果用自己的GPU服务器搭建云服务,肯定会影响其硬件销售收入。而租赁服务器的合作方式也保证了云服务提供商的现有收入(英伟达需要向它们支付租用服务器的费用),让供应商更容易接受这一提议。

但在这个条件下,英伟达要想盈利必须能获得一些客户溢价。而溢价正是来源于英伟达租赁服务器带来的灵活性。一石三鸟。

在GPU短缺的背景下,服务器很难找到,很多公司正在使用多个云服务提供商来尽可能多地获取这一资源。由于DGX Cloud在多个云服务提供商之间运行,它可能成为人工智能开发人员的一站式商店,为公司直接提供充足的GPU供应,而无须适应多个云服务平台。

灵活性的另一面是快速使用的可能。过往为了固定客户,云服务巨头会要求客户做出多年的巨额承诺来保证对稀缺GPU资源的访问权限。但在英伟达这里,DGX Cloud的客户可以随意快速访问GPU服务器,而无须保证长期使用。每月3.7万美元的价格,就可以让他们快速租用带有8个A100 GPU的云服务器。

这种灵活性是英伟达获得溢价优势的核心竞争力。在AWS, A100 GPU服务器的成本在每小时32美元到40美元之间,即每月2.4万美元到3万美元。

对此,英伟达副总裁兼总经理查理·博伊尔在电话会上表示:“我们的定价表明这属于高端服务,我们绝对不是为了在这个市场上试图与任何人在价格上进行竞争。”

黄仁勋:他如何用AI一颗子,打吃3000亿美元的云棋局

查理·博伊尔:有卡,就是高端

超车:依托硬件的软件优势

除了出租服务器进行算力支持外,云供应商的核心竞争点是相关的软件服务。

今年以来,各个云大厂都连环发布针对AI的优化性服务。这从各个硅谷巨头在各种开发者大会上层出不穷的AI软件功能更新就可见一斑。如Azure在今年就做了大量针对生成式AI的升级,支持多模型部署,给出“数据标记”的新功能,还引入了一项新的“模型可解释性”功能,允许用户了解他们的模型是如何做出决策的。

相较于这些更早入场的云大厂,DGX Cloud却在AI服务方面做到了弯道超车。

据几位直接了解该服务的人士透露,英伟达的工程师利用他们对该公司芯片的深入了解,对DGX Cloud服务器进行了调整,使其性能优于云服务提供商出租的其他专注于人工智能的服务器。

新推出的英伟达云服务可以帮助客户开发人工智能模型,还可以为客户提供预先训练好的模型,以便他们为自己的业务进行特别定制。这些预训练模型包括英伟达用于生成文本的Megatron 530B模型(类似于ChatGPT),以及用于识别视频片段中人类的PeopleNet视觉模型。

黄仁勋:他如何用AI一颗子,打吃3000亿美元的云棋局

英伟达:我的云好处太多啦

博伊尔表示,英伟达使用其软件来提高DGX Cloud服务器的性能。黄仁勋在8月份的分析师电话会议上表示,英伟达和云服务提供商的工程师“携手合作”,提高位于提供商数据中心的DGX Cloud GPU服务器性能。

不管怎样,至少有一家DGX Cloud的客户表示,他们已经注意到了这种差异。Anyscale是一家销售用于构建人工智能应用软件的公司,其联合创始人艾恩·斯托伊卡(Ion Stoica)表示,与传统云服务提供商为客户提供的GPU服务器相比,DGX Cloud“性能高,价格也很有竞争力”。

合作:英伟达的特洛伊木马

目前看来,似乎英伟达和云供应商的合作属于双赢,两者都获得了收入和业务的扩展。

但这种在其他云服务商的服务中单独辟出的DGX CLOUD 更像是英伟达塞进竞争对手中的特洛伊木马。因为允许英伟达绕过服务商,直接向AWS、微软、谷歌和甲骨文的客户销售自己的人工智能相关软件,最终会让老黄自己成为一个云巨头,削弱云服务提供商的竞争力,

对于传统的云服务提供商来说,DGX Cloud的崛起可能会让他们转变为服务器租赁中介。例如,ServiceNow使用DGX Cloud开发人工智能,总结 IT请求并为客户服务聊天机器人提供支持。这家IT软件巨头的高级副总裁约翰·西格勒(John Sigler)表示,英伟达的服务使ServiceNow更容易在自己的数据中心运行新的人工智能软件,也更容易在多个云服务提供商之间同时运行,因为它可以使用英伟达的“单一软件平台”来管理这一过程。

因此,ServiceNow不需要跟踪是哪个传统云服务提供商在幕后为其人工智能开发提供服务器。西格勒称:“如果英伟达的云服务使用微软或谷歌的数据中心,那完全没问题。”根据The Information的云数据库,ServiceNow每年至少花费7500万美元购买微软的云服务。

连横:拉帮斗地主

AWS 的拒绝实属无奈。作为云服务的霸主。它从这个合作中只能拱手让出核心客户,但没法收获更大的市场占有。

在上个月的季度财报电话会议上,当被问及这项新的云服务时,英伟达首席执行官黄仁勋表示,云服务提供商“很喜欢它”。然而,许多云服务提供商的发言人都没有对本文发表评论,除了甲骨文3月份发布的新闻稿外,没有一家云服务提供商在其网站上推广英伟达的服务。AWS发言人也拒绝置评。

伯恩斯坦(Bernstein)分析师斯泰西·拉斯冈(Stacy Rasgon)表示:“我完全能理解亚马逊为什么不参与英伟达的云服务,因为归根结底,英伟达最后才是真正拥有客户关系的公司。”相比之下,同意推出DGX Cloud的云服务提供商规模比AWS小,因此理论上它们可以借此与AWS竞争并获得市场份额。

黄仁勋:他如何用AI一颗子,打吃3000亿美元的云棋局

AWS:遥遥领先

但英伟达并不承认它成为云巨头的野心。在一次采访中,博伊尔反驳了一种说法,即英伟达正在与传统云服务提供商竞争,并称其新的云服务“不是英伟达想要控制客户和云服务提供商,这是众所周知的事情”。对于AWS拒绝接受英伟达服务,博伊尔解释称,AWS始终是一个“很好的合作伙伴,但每家公司都有自己的业务限制”。

但实际上,客户已经到手了。英伟达DGX云服务的客户已经包括一些云服务的最大买家,比如IT软件巨头ServiceNow、生物制药公司安进(Amgen)和保险公司CCC Intelligent Solutions。黄仁勋在上个月告诉分析师,DGX Cloud取得了“巨大的成功”,但没有透露具体的收入情况。

英伟达的野心

从英伟达的角度来看,在传统云服务提供商的数据中心内推出类似特洛伊木马的云服务至关重要。

虽然英伟达和云服务提供商相互依赖,但双方的关系正变得更加复杂和有争议。AWS、微软和谷歌已经销售或正在为云客户开发自己的人工智能服务器芯片,希望减少他们对英伟达芯片的依赖,因此英伟达也理所当然地将它们视为竞争对手。

想要持续保持自己在硬件上的霸主地位,最好的方法就是自己握住云服务这个GPU使用的主要入口。

因此,除了木马计划,英伟达还采取了其他措施,试图削弱传统云服务提供商的实力,即支持它们的竞争对手。英伟达将宝贵的H100 GPU芯片分配给了专门租用GPU云服务器的新兴云公司,包括CoreWeave、Lambda Labs和Crusoe Energy,这些公司发展迅速,而传统云服务公司却在努力让自己的新H100服务器启动和运行。

获得英伟达芯片的特殊使用权限并不是免费的。据报道,由于无法得知的原因,这家芯片设计公司询问并收到了那些规模较小的人工智能云提供商的客户名单,这一不同寻常的举动突显了其王者地位。但这种做法让英伟达获得了更多有关云计算客户的信息,该公司未来可以向这些客户销售服务。

另外一个英伟达不得不参与进来的理由是,云服务使英伟达能够销售用于管理用于开发人工智能模型的大型数据集的软件。在之前,英伟达基本没有机会突破云巨头们的市场坚壁。但这次靠着AI崛起,它有了这个底气。

为此英伟达开发了与Databricks和Snowflake以及微软的类似产品竞争的软件。英伟达在8月份的季度报告中告诉投资者,向开发涉及人工智能或虚拟现实的应用程序的公司出售软件,是一个潜在规模达3000亿美元的巨大商机。

黄仁勋:他如何用AI一颗子,打吃3000亿美元的云棋局

云服务里,SaaS才是营收大头

该公司首席财务官科莱特·克雷斯(Colette Kress)在8月份的季度财报电话会议上表示,软件业务每年创造数亿美元的收入,尽管这与芯片业务相比只是九牛一毛,但仍有望增长。

垄断已经形成

英伟达正处于前所未有的状态中。迄今为止,该公司是由OpenAI ChatGPT引发的生成式人工智能热潮的最大受益者。随着云服务提供商和其他公司竞相为企业和消费者推出新的人工智能服务,英伟达已经获得了价值数百亿美元的新订单,使这家芯片设计公司的市值超过了1万亿美元。

没有证据表明英伟达强迫传统云服务提供商允许其推出DGX Cloud,或者强制要求他们将收到的H100芯片的特定比例分配给该服务。但由于英伟达的芯片供不应求,美国联邦贸易委员会(FCC)的反垄断监管部门最近在一篇博客文章中表示,他们正在密切关注英伟达,以寻找其在“高度集中的市场”中不公平行使权力的迹象。该机构去年曾起诉英伟达,要求其停止收购芯片设计公司Arm,英伟达最终放弃了这笔交易。

英伟达表示,其云服务的主要目的是向云服务提供商展示在其数据中心配置GPU服务器的正确方法,以使其更好地工作。这可能会使GPU在客户眼中比其他专注于人工智能的硬件更受欢迎。英伟达企业计算副总裁曼努维尔·达斯(Manuvir Das)本周在旧金山举行的高盛会议上表示,该公司推出DGX Cloud的目标是让云服务提供商说:“非常感谢英伟达,现在我正在扩大规模。”换句话说,云服务可以帮助英伟达保持其在人工智能硬件市场的垄断地位。(达斯是向黄仁勋汇报工作的大约40名高管之一)。

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。如本文内容影响到您的合法权益(内容、图片等),请及时联系本站,我们会及时删除处理。

推荐资讯


最新上架


WolframAlpha
WolframAlpha
使用Wolfram的突破算法计算的专家级答案,知识库,和人工智能技术。数学,科学的
Yip
Yip
输入您的笔记和犬吠将自动生成问题。
MindSmith
MindSmith
创建和共享micro-courses Mindsmith是你的实验室。世界变化太快依靠笨重的、过
TutorAI
TutorAI
导师的人工智能是一个AI-powered学习平台。您可以输入任何话题,它会为你提供各
Quizgecko
Quizgecko
AI-Powered发电机测试问题。自己做测试使用人工智能。适合教师、学习和人力资