ChatGPT,最近网络最火的话题,谷歌、微软、百度等科技巨头纷纷加入角逐。
不过,今天我不是要比较分析哪一个更有前途,而是想和大家聊一聊它背后的两位赢家。
ChatGPT的响应能力强,是因为它要经过大量的数据训练,需要强大的算力部署,而算力依赖于底层芯片。 ChatGPT 比赛必然会引发对高端芯片的需求。
ChatGPT回应的每一句话都是“烧钱”,花在算力上的真金白银最终都流入了AI芯片龙头英伟达和先进制程寡头台积电的腰包。
这一幕是不是似曾相识?
类似的情节在比特币暴涨和“筹码荒”时期曾上演过。
< /p>
巨人冲向ChatGPT
在ChatGPT迅速走红后,竞争者纷至沓来。首先,谷歌宣布向人工智能初创公司Anthropic投资约3亿美元,同时推出基于大型语言模型LaMDA的聊天机器人Bard,并宣布将其嵌入其搜索中引擎。
微软紧随其后,推出了AI驱动的Bing搜索引擎和Edge浏览器,以类似ChatGPT的方式回答用户的搜索问题。
值得一提的是,2019年,微软向ChatGPT的所有者OpenAI投资了10亿美元,而在今年1月底,微软宣布扩大与OpenAI的合作伙伴关系,为OpenAI提供多年来,价值数十亿美元的投资加速了人工智能的技术突破。
投资合作不够。微软亲自将ChatGPT技术集成到搜索引擎中,可见其再次挑战谷歌的决心。在目前的全球搜索引擎市场,谷歌依然是绝对的老大,地位几乎不可动摇,市场份额高达93%,微软的必应以3%的份额位居第二。
国内巨头也不甘示弱,紧跟这波AI热潮。百度“ChatGPT类应用”ERNIE Bot将于今年3月完成内测并对外开放。内测包括答案回复、智能生成等。
阿里达摩院主导的类ChatGPT对话机器人也在开发中,目前在测试阶段对公司员工开放,以及它可能与钉钉深度集成。
< /p>
最重要的是计算能力
ChatGPT(Generative Pre-trained Transformer)的强大响应能力很大程度是因为它拥有的数据量大忍受的火车。
目前的ChatGPT是基于GPT-3.5架构开发的对话AI模型。从模型开发的迭代过程来看,参数数量的增长是爆炸性的。
OpenAI在2018年推出GPT-1模型时,其参数在亿级别,预训练数据量只有5GB。同年,谷歌推出的BERT模型参数数量达到3.4亿。
随后,OpenAI分别在2019年和2020年赶上并迭代了GPT-2和GPT-3模型。到GPT-3时,参数数量增加到1750亿,预训练数据量也增加到45TB。
如此大量的参数计算,意味着ChatGPT需要强大的算力来支撑其训练和部署,而算力依赖于底层芯片。
相对于GPT模型参数量的增加,GPU芯片的容量从2017年V100的32GB增加到2020年A100的80GB,两者的增长幅度显然不大在相同的数量级。
因此,要在基础模型上完成大规模的预训练,至少需要导入几万块GPU。
图:大型Transformer模型的参数量呈指数增长,但单个GPU的显存仅以每2年2倍的速度增长
ChatGPT离不开迭代过程 在微软的帮助下,Microsoft Azure AI 超级计算机为 ChatGPT 提供训练支持。
根据微软公布的数据,为OpenAI开发的超级计算机是一个单系统,拥有超过285,000个CPU、10,000个GPU和每台GPU服务器每秒400GB的网络连接,堪比世界Top5超级计算机。
ChatGPT的知识还仅限于2021年的数据,需要随着时间的推移不断完善,模型的不断迭代需要越来越多的算力。
根据 OpenAI 在 2018 年发表的一项研究,自 2012 年以来,AI 训练运行中使用的计算量呈指数级增长,大约每 3.4 个月翻一番,相比摩尔定律的翻倍周期为 18-24个月。
从2012年到2018年,AI训练的算力消耗增长了30万倍,而摩尔定律同期只产生了7倍的增长。
图:从AlexNet到AlphaGo Zero,算力提升30万倍
数据来源:OpenAI
推动人工智能进步的关键因素包括算法创新、数据和可用于训练的计算量。算法创新和数据难以追踪,但计算量是可以量化的。更多的计算可以预见地带来更好的性能。这又是基于硬件的。
< /p>
背后的赢家:英伟达和台积电
从AI芯片的市场格局来看,英伟达是GPU和AI计算平台的全球领导者,根据以 Omdia 为例,2020 年,英伟达在面向云和数据中心的 AI 处理器市场占据了 80.6% 的收入份额。
IDC数据显示,2021年英伟达在企业级GPU市场的份额将达到91.4%,而AMD仅为8.5%。在 Top500 的超级计算机中,近 70% 由 Nvidia 支持。微软为 OpenAI 开发的超级计算机所使用的 GPU 由 Nvidia 提供。图:四大云计算专用加速器份额
结果,在这一轮ChatGPT热潮之下,Nvidia的股价也受到了消息的影响,Nvidia涨了16 % 自 1 月底以来。智能手机、PC、平板遇冷后,上游芯片厂商的目光转向了AI领域。
除了英伟达,英特尔在接连收购了Altera、Nervana、Movidius等人工智能初创公司后,也在积极迎头赶上; AMD计划今年推出新的Alveo V70 AI芯片;苹果M2系列芯片继续引入AI加速器设计。
当2022年半导体行业陷入“寒冬”之际,英特尔和AMD急于寻找新的增长点,但后面这几家公司还未能对英伟达形成冲击。
花旗集团估计,ChatGPT 可能会在未来 12 个月内为 Nvidia 带来 30 亿至 110 亿美元的销售额。
2022财年,英伟达营收达到创纪录的269亿美元,其中数据中心业务贡献了106亿美元,占总营收的40%。
随着芯片厂商陆续进入新技术的大规模试产阶段,对芯片制造资源的争夺也开始展开,台积电的先进制程能力成为争夺的对象。
< /p>
在先进制程产能和出货量上,台积电独占鳌头。根据台积电最新公布的2022财年第四季度财报,台积电第四季度实现营收205亿美元,两年来首次低于预期,但受益于先进制程营收扩大,其中5nm工艺收入占比32%。 7nm营收占比22%,净利润(97亿美元)和毛利率(62.2%)均创历史新高。
按产品类型划分,高性能计算(HPC)收入环比增长4%,占收入的42%,不断取代传统强劲的智能手机业务(占收入的38%),并稳坐台积电第一大收入来源。
目前,智能手机的需求依然疲软。已经进入量产阶段的3nm却遭遇“断单”。高昂的成本让苹果和高通持谨慎态度。
台媒此前报道称,随着大厂开始调整订单,台积电2023年第一季产能利用率将大幅下滑。该公司的 N7 线(7nm、6nm 技术)的利用率将在 2023 年初下降至 50% 左右。
ChatGPT 的迅速走红可能挽救了苦苦寻找买家的台积电。近日有消息称,英伟达和AMD同时向台积电下了紧急订单,相关芯片将在4月后逐步量产。
根据研究机构Couterpoint的预测,Nvidia和AMD的新品集中在4nm和5nm。预计2023年下半年之后,采用台积电3nm工艺的CPU和GPU产品将陆续推出。 2023年,台积电5nm家族的产能大约有一半被AMD和英伟达包揽,另一半被苹果拿下。
< /p>
比特币再次繁荣?
这一幕似曾相识。在比特币的暴涨期,挖矿收益的上涨导致矿机需求量急剧增加。与高性能计算一样,挖矿对算力的要求也很高,这反过来又推动了对先进制造工艺的竞争。 2017年,比特币从2016年底的900多美元飙升至近2万美元,一年内涨幅最高近20倍,矿机巨头业绩也迎来集中爆发。
当时,占全球矿机市场份额约70%的比特大陆2017年营收为25.17亿美元,较2016年的2.78亿美元增长近8倍比特大陆在2017年成为台积电三大客户之一,挖矿芯片占台积电当年总销售额的10%。
来源:比特大陆招股书 既然科技巨头纷纷加入ChatGPT竞争,算力作为最重要的基础自然是不可或缺的,而算力的背后资源就是筹码,当ChatGPT竞争开始时,必然会引发对高端芯片的需求,从而推高价格。类似的情节在比特币暴涨和“筹码荒”时期上演过。
< p>目前,Nvidia A100GPU的采购成本超过9000美元。此外,根据OpenAI 2018年披露的数据,用于训练的硬件采购成本高达数百万美元。< p>无论是开发培训还是后续运营,ChatGPT回应的每一句话都是“烧钱”,科技巨头靠AI技术台前收割流量,花在算力上的真金白银最终流入了用户的腰包英伟达和台积电。澳洲中文论坛热点
- 悉尼部份城铁将封闭一年,华人区受影响!只能乘巴士(组图)
- 据《逐日电讯报》报导,从明年年中开始,因为从Bankstown和Sydenham的城铁将因Metro South West革新名目而
- 联邦政客们具有多少房产?
- 据本月早些时分报导,绿党副首领、参议员Mehreen Faruqi已获准在Port Macquarie联系其房产并建造三栋投资联