9月11日星期三美国股市中午,英伟达首席执行官黄仁勋在高盛组织的技术会议上与高盛首席执行官所罗门进行了交谈。他关于“AI芯片巨大需求”导致“英伟达与客户关系紧张”的言论引爆美股方面,几大股指尾盘彻底抹平盘中跌幅,实现V型反弹,科技与芯片齐飞领涨个股尤其引人注目。
英伟达美股早盘一度小幅走低,跌至107美元。随后,随着黄仁勋的讲话,涨幅不断扩大。截至交易日收盘,仍创出日内新高,最高涨幅达8.4%,一度突破117美元。 ,从日低到日高的幅度高达9%。
最终,英伟达收涨8%,为六周来最大涨幅,市值增加2500亿美元。连续三天上涨,收复了8月30日以来的大部分跌幅。
有分析师指出,这是自2022年10月以来,即近两年来,标普500指数和纳斯达克100指数首次完全抹平至少1.5%的盘中跌幅。 。也就是说,英伟达和黄仁勋在当天早些时候一手击败了美国8月CPI重磅通胀数据对美股的所有影响。
<强风格="color: red;">
以毒舌着称的财经博客Zerohedge称,上周五非农数据公布后,美国股市集体下跌逾1%,跌至低点,但黄仁勋的话一度再次挽回局面,“无论如何,市场听到的是‘需求强劲’”
华尔街新闻提到,他印象最深的一句话就是AI芯片Blackwell太受欢迎了,已经令客户不满意的是,Nvidia 的产品现在已成为科技行业中最受欢迎的商品,客户争夺有限的供应:“每个人都指望着我们……对我们产品的需求是如此之大。”太好了,每个人都想成为第一个获得它的人,都希望获得最大的份额。今天我们可能有更多情绪化的客户,这是可以理解的,但我们正在尽力而为。”
本次谈话的完整记录如下。来自 Newin),享受吧~
所罗门:
自从您于 1993 年创立 NVIDIA 以来,您一直是加速计算领域的先驱。该公司于 1999 年发明的 GPU 推动了 PC 游戏市场的增长,重新定义了计算,并点燃了现代人工智能时代。 Jensen 拥有俄勒冈州立大学学士学位和斯坦福大学硕士学位。
我想从 31 年前你创立公司的时候开始。从一家以游戏为中心的GPU公司,到现在为数据中心提供广泛的硬件和软件服务的公司。
我想请您谈谈这次旅程的各个方面。您刚开始创业时的想法是什么?公司一路走来是如何发展的?这是一次非常不平凡的旅程。也许您可以顺便谈谈您展望未来时的主要优先事项以及方向。
黄仁勋:
我觉得我们当时做对的一件事就是我们有一个愿景,那就是会有一种新的计算方法可以弥补现有计算方法的不足。通用计算。解决通用计算器永远无法解决的问题。
这款处理器最初是从计算机图形学开始的,这对 CPU 来说是一项极其困难的任务,但我们知道它最终会扩展到其他领域。
我们选择的第一个领域是图像处理,它是计算机图形学的补充。然后我们扩展到物理模拟,因为在我们选择的视频游戏应用领域,你不仅需要漂亮的图形,还需要动态效果来创建虚拟世界。
我们正在一步步向前,将其带入科学计算领域。我们最早的一些应用是分子动力学模拟,另一个是地震处理,基本上是逆物理。地震处理与 CT 重建非常相似,CT 重建是逆物理的另一种形式。就这样我们一步步向前迈进。
我们思考相邻行业和互补算法来逐步解决问题。但从那时起,人们的共同愿景是加速计算可以解决有趣的问题。
如果我们能够保持架构一致性,就意味着今天开发的软件可以运行在你留下的更大的算力基础上,过去开发的软件可以通过新技术进一步加速。这种关于架构兼容性的思考方式始于 1993 年,并且一直延续到今天。
这就是为什么 NVIDIA 的 CUDA 拥有如此庞大的安装基础。因为我们始终保护它,保护软件开发者的投资,这一直是我们公司的首要任务。
展望未来,一路走来,我们学到了很多东西,比如如何做创始人、如何做CEO、如何经营公司、如何打造公司,而不仅仅是这些。这些都是新技能。我们还学习了如何发明现代电脑游戏产业。
许多人不知道 NVIDIA 拥有全球最大的游戏架构安装基础。 GeForce 拥有约 3 亿游戏玩家,其增长依然强劲且充满活力。
所以每次进入一个新的市场,我们都需要学习新的算法,了解新的市场动态,创建新的生态系统。我们这样做的原因是,与通用计算器不同,如果您构建加速处理器,一切都不会自动工作。作为加速计算器,您需要问自己:什么应该加速?因为没有通用加速器。
Solomon:
更深入地讨论一下通用计算和加速计算之间的区别。
黄仁勋:
如果你看一下软件,从你写的庞大软件中,你会发现很多部分涉及到文件的输入输出、数据结构的设置以及一些神奇的功能。核心算法的一部分。
这些算法根据应用领域的不同而有所不同,无论是计算机图形、图像处理还是任何其他领域。它可能是流体动力学、粒子系统或我提到的逆物理,甚至是图像处理领域的东西。这些不同的算法都有所不同。
如果你创建一个在这些算法上表现特别好的处理器,并且可以补充CPU的不足(CPU能做的,它擅长做的),那么理论上你可以极大地加速一个应用程序。
原因是,通常,5% 到 10% 的代码占用了 99.99% 的运行时间。因此,如果您将 5% 的代码卸载到我们的加速器上,理论上您可以将应用程序加速 100 倍。这并不罕见,我们经常这样做。
例如,我们将图像处理速度提高了500倍。现在我们也处理数据处理,这是我最喜欢的应用之一,因为几乎所有与机器学习相关的东西都是数据驱动的,而数据处理是其中的核心部分。
无论是SQL数据处理、Spark类型数据处理,还是向量数据库处理,这些都涉及结构化或非结构化数据处理,即数据帧处理。
我们大大加快了这些过程,但要做到这一点,您必须创建相应的库。例如,在计算机图形学中,我们很幸运拥有像 OpenGL 和 Microsoft 的 DirectX 这样的图形库。但除此之外,很少有现成的库可用。
因此我们创建了自己的库,例如我们最著名的库之一,类似于 SQL 等库。 SQL是一个用于存储计算的库,我们创建了一个名为CuDNN的库,它是世界上第一个神经网络计算库。
我们还有用于组合优化的 CuOpt、用于量子模拟和仿真的 CuQuantum 以及用于数据帧处理的 CuDF 等库(类似于 SQL)。
所有这些库都需要我们发明它们。我们需要重构应用程序中的算法,以便它们可以在我们的加速器上运行。如果您使用这些库,您可以获得 100 倍或更多的加速。
这个想法非常合理,但问题是如何发明这些算法并让整个视频游戏行业使用它们?如何让整个地震处理和能源行业都使用它?如何让整个AI行业都使用它?你明白吗?
我们首先要做计算机科学研究,然后开发生态系统并说服每个人都使用它。同时,我们还必须确保这些库可以在所有不同的计算机上运行。我们就是这样走的,一个区域又一个区域。
我们为自动驾驶汽车创建了丰富的库,为机器人技术创建了丰富的库,为虚拟筛选库创建了库,无论是基于物理的虚拟筛选还是神经网络虚拟筛选。我们甚至有一个专门的气候技术图书馆。
所以我们一块一块地开发,结交朋友,创造市场。 NVIDIA 真正擅长的是开拓新市场。
我们做了这么久,看起来加速计算无处不在,但实际上我们正在征服一个又一个领域。
所罗门��
我知道在座很多投资者都非常关注数据中心市场。听到您的观点以及公司的长期和中期机会将会很有趣。显然,您的行业正在推动下一次工业革命。您认为行业面临哪些挑战?告诉我们您如何看待数据中心市场的发展。
黄仁勋:
有两件事同时发生。两者经常被混淆。我们需要将它们分解并讨论。首先,我们假设不存在人工智能。
在没有人工智能的世界里,通用计算已经达到了瓶颈。大家都知道,摩尔定律以及晶体管尺寸缩小和相同功率下性能提升或者相同成本下性能提升的时代已经结束了。
未来,我们将不再看到CPU性能每年翻倍。我们很幸运地看到性能在 10 年内翻了一番。
过去,摩尔定律是性能每5年提高100倍,每10年提高1000倍。我们只需要等待 CPU 变得更快。然而,这个时代已经结束,我们正在进入计算膨胀的时代。
所罗门:
现在,随着摩尔定律的终结,我们正在经历计算膨胀。
黄仁勋:
所以我们要做的就是尽可能加快一切速度。无论是SQL处理,还是任何形式的数据处理,特别是如果你正在建立一个有推荐系统的互联网公司,它绝对需要加速。这些系统现在已全面加速。
几年前,它们都在 CPU 上运行,但现在世界上最大的推荐系统的数据处理引擎都在加速。因此,如果你有推荐系统或搜索系统,或任何大规模数据处理系统,你必须加快它们的速度。
接下来发生的第一件事就是全球数万亿美元的通用数据中心将升级为加速计算数据中心。这将会发生。这是不可避免的。
原因之一是我们已经到了必须做出改变的阶段。您将看到的第一个动态是计算机密度的增加。要知道,这些巨大的数据中心效率非常低,因为它们充满了空气,而空气是电的不良导体。
我们想要做的是将这些原本可能为 50、100 或 200 兆瓦的大型数据中心压缩为一个非常小的数据中心。如果你看看我们的一些服务器机架,Nvidia的机架可能看起来很贵,每个机架可能要几百万美元,但它可以替代数千个节点。
令人惊讶的是,仅连接旧式通用计算系统的电缆成本就可能超过用高密度机架替换旧设备的成本。
致密化的另一个好处是,一旦达到如此高的密度,就可以进行液体冷却,因为冷却大型数据中心很困难,而冷却小型数据中心则容易得多。
因此,我们现在的首要任务是加速和现代化数据中心,提高其密度并提高能源效率。您可以节省金钱、节省能源并变得更加高效。
这是我们未来10年的重点。现在,当然还有第二个动力。得益于 NVIDIA 加速计算带来的巨大成本节省,计算能力在过去 10 年中不仅增长了 100 倍,而且增长了 100 万倍。
所以问题就变成了:如果你的速度快一百万倍,你会采取什么不同的做法?突然间,人们说,“嘿,为什么我们不让计算机编写自己的软件,而不是我们尝试找出函数或算法?我们只需向计算机提供所有数据,所有预测数据,并让它找出算法。”
我们在许多不同领域的数据上执行此操作,计算机现在不仅能够处理数据,而且还能够理解数据。同时理解多种模式,它可以实现数据翻译。
我们可以将英语翻译成图像,将图像翻译成英语,将英语翻译成蛋白质,将蛋白质翻译成化学分子。现在,它已经能够完成这些翻译操作,我们称之为生成式人工智能。
可以从大规模文本生成小规模文本,并且可以反向生成文本。现在我们已经进入了一个时代。
令人惊奇的是,第一个耗资数万亿美元的数据中心已经能够得到加速。我们在人工智能中发明了这种新的缓冲技术,这场人工智能革命不仅仅是一种工具,更是一种技能。
这就是为什么现在创建了一个全新的行业。因为,如果你把 IT 行业作为一个整体来看,到目前为止,我们一直在制造人们可以使用的工具和仪器。这一次,我们要创造的是增强人们能力的技能。
这就是为什么人们相信人工智能将不仅限于万亿美元的数据中心,还将扩展到技能领域。
那么,这个技能是什么?第一个是数字技能,例如数字化流水线机器人,或者数字化客服机器人,比如负责规划和业务规划的数字化视觉员工。
它也可以是数字 SAP 代理。我们公司使用了大量的ServiceNow服务,我们甚至还有数字化员工服务。现在我们有了这些数字“人”,这就是人工智能的工作原理。
所罗门:
让我们退一步,从另一个角度思考一下。基于你刚才所说的一切,金融市场上一直在争论我们在构建人工智能基础设施时能否获得足够的投资回报率。
您如何评估客户在当前周期的投资回报率?如果我们回顾云计算,在其采用周期的类似阶段,投资回报率表现如何?我们现在的处境与当时相比如何?
黄仁勋:
在云计算之前,虚拟化是主流,还记得吗?虚拟化基本上是将数据中心中的所有硬件虚拟化为虚拟数据中心。
然后,我们可以将工作负载转移到整个数据中心,而不是将其直接绑定到特定机器。因此,数据中心利用率得到提高。
通过虚拟化,数据中心成本可以降低一半甚至更多。在此基础上,我们将这些虚拟计算机推送到云端,多个公司可以共享相同的资源,进一步提高利用率。
过去10到15年,虚拟化和云计算的发展掩盖了幕后发生的根本性变化——摩尔定律的终结。虚拟化和云计算带来了显着的成本节省,但它掩盖了晶体管缩放和 CPU 性能提升的终结。
现在,随着这些成本节省逐渐消失,我们看到的是数据中心和计算的扩展。所以首先发生的是计算加速。
如今,您可以使用 NVIDIA 的加速器在云端进行数据处理,例如 Spark,它是当今世界上最常用的数据处理引擎之一。如果您使用 Spark 并在云中使用 NVIDIA 加速器,通常可以看到 20 倍的加速。
这样一来,就可以节省大量的计算时间,虽然计算成本会略有增加,但总体回报非常可观。这就是加速带来的直接ROI。
接下来是生成式人工智能的第一波浪潮。在这个阶段,像我们这样的基础设施提供商以及所有云服务提供商都将基础设施部署到云端,以便开发人员可以使用这些机器来训练模型或微调模型。
这提供了非常好的回报,因为需求非常强劲。每花一美元都会带来五倍的回报。这种情况正在全球范围内发生。
就像我们熟悉的一些应用程序,例如 OpenAI 的 ChatGPT,或者像 Github Copilot 这样的工具,它们带来的生产力提升是惊人的。
如今,我们公司几乎所有的软件工程师都在使用这些构建工具,无论是我们自己开发的工具还是使用C++和CUDA进行协作构建的工具。
未来,每个软件工程师都会有一名数字工程师作为助手,24小时协助他们工作。这是未来的趋势。
我们公司拥有 32,000 名员工,但我们希望通过数字工程师将这个数字增加 100 倍。许多行业已经积极拥抱这一趋势。
在我们公司,人工智能已经成为计算机图形学的重要工具。现在,我们通过计算 1 个像素并推断剩余 32 个像素来完成图像生成,从而显着节省能量和计算时间。
没有人工智能,我们就无法支撑自动驾驶产业,也无法完成机器人和数字生物学的研究。几乎所有科技生物公司都在使用人工智能进行数据处理,甚至蛋白质生成和虚拟筛选。由于人工智能,整个新药发现过程正在被重新发明,这是非常令人兴奋的。
所罗门:
现在,让我们谈谈您的竞争优势。显然,有上市公司和私营公司寻求挑战你的领导力。您认为您的竞争障碍是什么?
黄仁勋:
首先,我们有一些独特之处。首先要记住的是,人工智能不仅仅是硬件,还涉及基础设施。今天的计算机不仅仅是制造芯片和销售芯片。
构建人工智能计算机不是简单地组装芯片,而是构建一个完整的数据中心。比如我们的Blackwell系统是由七种不同类型的芯片组成的,Blackwell只是其中之一。
所罗门:
是的,告诉我们关于布莱克威尔的事。
黄仁勋:
当你想要建造一台人工智能计算机时,人们可能会提到“超级集群”或“超级计算机”之类的术语,因为它不仅仅是一个芯片或一台计算机。不是一台计算机,而是整个数据中心。
如果您查看这些超级集群,请想象一下运行它所需的软件。现在没有Microsoft Windows来运行这些系统,每个系统的软件是�完全定制。
设计芯片的公司还将设计超级计算机及其所有软件。因此,拥有一个全面优化、更高效、更节能的系统是有意义的。
第二,人工智能涉及到算法,我们非常善于理解算法的需求,以及如何将计算工作分配到数百万个处理器中,以保证计算能够长时间稳定运行,同时达到极高的计算效率。性能 能源效率和快速完成任务。这是我们特别擅长的领域。
归根结底,人工智能是关于计算的,而计算的关键是安装基础。拥有相同的架构,无论是在云端还是本地,无论是在超级计算机、机器人还是PC上运行,拥有一个可以运行相同软件的统一架构非常重要。
这种一致性是我们过去 30 年所坚持的,也是为什么如果你今天要建立一家公司,最明显的选择就是使用 NVIDIA 架构。
我们的架构适用于任何地方,因此无论您选择什么计算设备,借助 NVIDIA Inside,您都知道它可以运行您需要的软件。
所罗门:
你的创新速度非常快,我想请你谈谈布莱克威尔。它的训练速度比上一代 Hopper 快四倍,推理速度快 30 倍。你们似乎正在以惊人的速度进行创新。你觉得你能保持这么快的节奏吗?当您想到您的合作伙伴时,他们如何跟上您快速的创新步伐?
黄仁勋:
我们的创新节奏基于一个基本思路:每次开发七种不同的芯片。每个芯片的更新周期大概是两年,每年我们都可以给他们一个中期的改进。
但如果每两年推出一个新架构,就相当于以光速移动。我们有七种不同的芯片,它们都有助于提高性能。
因此,每年我们都可以推出比上一代更好的人工智能集群或超级集群,因为我们有很多不同的组件可以优化。
这种规模的性能改进将直接转化为客户的总拥有成本 (TCO)。例如,Blackwell的性能是其前身的三倍,如果客户的功率预算为1吉瓦,他们的收入也将增加两倍。
这种性能改进转化为吞吐量,而吞吐量又转化为收入。对于具有固定功率预算的客户来说,这意味着收入增加了三倍。没有其他成本节约措施可以抵消这种收入增长。
因此,通过集成所有这些不同的组件并优化整个堆栈和集群,我们能够为客户提供更高的价值。
同样,性能的提高意味着无论客户愿意花多少钱,成本都会降低。我们拥有最好的每瓦性能,即收入,而且我们还拥有最好的总拥有成本 (TCO),这意味着更好的毛利率。
我们继续推动市场的这些创新,我们的客户也将继续受益。而且由于我们的架构是兼容的,昨天开发的软件明天仍然可以运行,今天开发的软件将在整个安装基础上运行,这使我们能够快速前进。
如果我们每次都改变架构,这个速度是不可能达到的。构建系统本身花了一年时间。我们之所以如此之快,是因为我们将所有组件组合在一起。
有人在推特上表示,在我们发货后的 19 天内,他们就启动并运行了一个超级集群。你不可能在一年内拼凑出如此高效的系统。
因此,我认为我们为客户实现收入增长和毛利率改善的创新速度是相当惊人的。
所罗门:
你们的大多数供应链合作伙伴都在亚洲,尤其是台湾。在当前地缘政治背景下,您如何看待这一情况?
黄仁勋:
亚洲的供应链确实非常庞大、相互交织。人们常常认为,当我们想到 GPU 时,它就像一个小芯片。事实上,Nvidia 的系统有 35,000 个零件,重 80 磅,电流为 10,000 安培。
安装后,整个系统重 3,000 磅。这个 GPU 系统非常复杂,构建它就像构建电动汽车一样。我们设计了尽可能多的多样性和冗余机制,以确保供应链的稳定性。
我们拥有足够的知识产权,可以在必要时在不同的供应链之间灵活切换。也许某些生产技术不如最佳选择,也许性能和成本没有保持在同一水平,但我们仍然能够提供可行的解决方案。如果确实发生紧急情况,我们可以快速调整供应链。
我们之所以和台积电合作,是因为它是世界上最好的,不仅是优秀,而且绝对领先。它有着悠久的合作历史,并且非常灵活和可扩展。
英伟达去年营收出现爆发式增长,这与供应链的支持密不可分。台积电和供应链的响应速度令人难以置信。
在不到一年的时间里,我们产能已显着增加,明年还将继续扩大。这种敏捷性和响应能力是我们选择台积电的原因。当然,如果有必要,我们也可以选择其他供应商。
所罗门:
是的,公司确实处于非常有利的地位,我们讨论了很多好的事情。那么,你最担心的是什么?
黄仁勋:
嗯,我们公司目前正在与全球所有数据中心合作。我现在想不出有哪个数据中心、云服务提供商或计算机制造商不与我们合作。
所以,这意味着我们肩负着巨大的责任。许多人依赖我们并对我们抱有很高的期望。需求非常高,交付我们的组件、技术、基础设施和软件对很多人来说在情感上非常重要。因为这直接影响到他们的收入和竞争力。
所以今天我们可能有更多投入情感的客户,他们非常需要我们的产品并且充满情感。
我们可以感觉到每个人都在等待我们满足他们的需求,而一旦我们交付了这些产品,这种情绪就消失了。但现在的情绪非常强烈,压力也很大。
我们肩负重大责任,努力做到最好。我们正在努力让 Blackwell 投入全面生产。
我们将在第四季度出货,第四季度扩大产能,明年继续扩大。对Blackwell的需求实在是太大了,每个人都想成为第一个拥有它的人,每个人都想拥有最大的产能,每个人都想领先于其他人。
所以紧张气氛真的很强烈。我认为能够发明下一个计算时代真的很有趣,看到这些令人惊叹的应用程序被创建是令人兴奋的,看到机器人四处走动是令人兴奋的,看到这些视觉代理作为一个团队致力于解决问题也是令人兴奋的在你的电脑上是惊人的。
同时,我们用人工智能来设计芯片,然后用这些芯片来运行我们的人工智能,这都是非常了不起的。但其中真正重要的部分是我们肩负着世界的期望。
澳洲中文论坛热点
- 悉尼部份城铁将封闭一年,华人区受影响!只能乘巴士(组图)
- 据《逐日电讯报》报导,从明年年中开始,因为从Bankstown和Sydenham的城铁将因Metro South West革新名目而
- 联邦政客们具有多少房产?
- 据本月早些时分报导,绿党副首领、参议员Mehreen Faruqi已获准在Port Macquarie联系其房产并建造三栋投资联