(原标题:谁领有最多的GPU?)
如若您但愿不错往往碰面,接待标星保藏哦~
跟着东说念主工智能期间的到来,GPU成为了系数东说念主柔和的焦点。
但念念要最大化进度发达出GPU的AI熟练与推理功能,还要借助数据中心的力量,一座AI数据中心里往往装着满坑满谷的GPU,恰是通过这种协同作用,才有了像 ChatGPT 这么功能刚劲的聊天机器东说念主。
但AI数据中心的价钱并不低,动辄数十亿好意思元的造价,不啻是科技巨头们的专属,也让许多实力并不丰足的国度地区谨防三舍。
跟着使用东说念主工智能所能作念的事情越来越多,高端芯片的地缘政事进犯性也突飞猛进,越来越多的国度和地区正在竞相囤积芯片,致使还颁布了窒碍部分国度地区购买最顶端芯片的制裁行动,但落幕面前,对于全球东说念主工智能芯片确实切位置的公开数据却疏淡地衰退。
来自牛津大学互联网研究所老师 Vili Lehdonvirta揭露了一个不可淡漠的现实:GPU 高度蚁合在全球仅 30 个国度地区之中,其中好意思国和中国遥遥越过,而大部分地区齐处于所谓的“诡计萧疏”中:压根莫得 GPU 可供租用。
如何打听分散
全球AI诡计供应链大要不错分为四个部分:
瞎想和销售GPU偏执他与AI相干芯片的公司
制造和封装芯片的公司
部署芯片提供诡计技能的公司
破费诡计技能斥地或部署AI系统的公司
在GPU瞎想和销售方面的市集迷惑者是总部位于好意思国的Nvidia公司,芯片制造由台湾的台积电(TSMC)主导,而荷兰的ASML面前是唯独分娩光刻机的公司,这些机器对于制造首先进的芯片至关进犯(Miller 2022)。因此,诡计供应链的这些部分在地舆位置和系数权方面齐高度蚁合。
这项研究柔和的是供应链的第三步:全球哪些地区部署了芯片来提供AI诡计以用于AI斥地和部署,也等于用于熟练AI模子和运行现存模子的推理。大要上,有三类大畛域的诡计提供者:科学超等诡计方法、私东说念主诡计集群和所谓的全球云诡计提供者。
科学超等诡计方法自20世纪60年代初以来就已存在,频频由政府资助,主要用于学术和军事目标。OECD(2023)的一项研究对科学超等诡计方法进行了浅薄的地舆分析。凭据TOP500数据库,中国的超等诡计机数目最多,占32%;其次是好意思国,占25%;欧盟占21%。关联词,大多数科学超等诡计机并非为AI模子熟练瞎想(OECD 2023)。刻下生成式AI发展的茂盛主要依赖于私东说念主诡计集群和全球云诡计。之前的研究并未详备分析它们的地舆分散。
私东说念主诡计集群由渔利性公司领有,如Meta、HP以及许多微型公司。这些集群由部署在数据中心的GPU互连诡计机构成。一个私东说念主集群既不错用于该公司的AI斥地,也不错租给其他公司使用。全球云诡计提供者相通是渔利性公司。它们之是以被称为“全球”,并不是因为与政府研究,而是因为它们的服务是按需提供的,并由多个客户分享(即雷同于酒馆中“全球”的含义,而不是全球部门的“全球”)。全球云诡计市集的迷惑者包括AWS、Microsoft Azure和Google Cloud;中国的全球云提供者阿里巴巴和腾讯也提供大畛域AI诡计。这些大型提供者频频被称为“超大畛域诡计提供者”。
其中该研究主要柔和了全球云AI诡计的地舆分散。私东说念主诡计集群曾用于熟练一些标记性模子,如Meta的Llama和Llama 2。但大齐前沿AI模子的熟练和斥地蚁合在全球云的超大畛域提供者Google、Microsoft和Amazon,以及它们与越过AI公司的“诡计合营伙伴关系”中,如Anthropic、Cohere、Google DeepMind、Hugging Face、OpenAI和Stability AI。全球云还很进犯,因为它对许多不同类型的斥地东说念主员绽放,包括学术研究东说念主员。因此,咱们的主要研究问题是:全球全球云AI诡计的地舆分散情况如何?咱们还将探讨这些地舆分散的潜在原因,商议它们对诡计治理和地缘政事的影响,临了简要商议私东说念主集群和政府领有的国度AI诡计。
该研究的普查涵盖了六大超大畛域全球云提供商:AWS、Microsoft、Google、阿里巴巴、华为和腾讯。天然也有一些较小的提供商,但这六家占据了全球全球云市集的大部分份额,而且在各区域市聚集也处于越过地位。在普查进行时,熟练常见AI模子的最刚劲GPU是Nvidia于2023年推出的H100,之前的旗舰型号A100于2020年推出,V100更早于2017年推出。2023年,Nvidia引入了H800和A800以藏匿好意思国对中国的出口戒指,但这些戒指很快推广到了这些新式号。数据相聚的要点放在这五种与AI最相干的GPU类型上。
从普查数据库中,该研究构建了一个国度级的数据集,以便进行地舆分析。对于每个国度,其诡计了其疆域内的全球云区域总和,还诡计了至少维持一种GPU的区域(“维持GPU的区域”)的子集,以及维持特定GPU类型的区域子集。
为了补充云普查数据,研究进行了定性和半结构化的巨匠访谈。咱们总共采访了10位信息提供者,分手代表了两位政策巨匠、三位超大畛域全球云提供商巨匠和五位在AI诡计方面具有专科常识的研究巨匠。这些信息提供者通过咱们本身的专科相聚剿袭滚雪球采样方式招募。这些访谈的主要目标是篡改并考证普查方法,生成对于全球云AI诡计地舆分散的补充或替代信息,并匡助解释不雅察到的地舆模式。
AI GPU在那儿?
图1展示了普查中发现的全球云区域的大要位置。表4则浮现了每个国度有若干个云区域,以及这些区域中有若干提供GPU实例。从诡计治理的角度来看,数据中最进犯的特征之一是,寰球上绝大多数国度压根莫得全球云区域。在领有一个或多个云区域的39个国度中,有30个国度的云区域维持GPU。
另一个显耀特征是,即使在那些领有维持GPU的云区域的国度内,区域的地舆分散亦然高度极化的:中国和好意思国整个领有的区域数(49个)险些与寰球其他国度的总和(52个)终点。在这两者中,中国的GPU维持区域总和略高(27个)于好意思国(22个)。
进一步的分析不错通过磨练每个国度所提供的GPU实例类型来进行。最显著的模式是,好意思国不仅在不同类型实例的可用比例上领有寰球上最新和最刚劲的GPU,在完全数目上亦然如斯。好意思国事唯独一个提供2020年Nvidia A100 GPU的区域多于2017年V100 GPU的国度。好意思国还领有多个提供2023年Nvidia H100 GPU的区域。中国的云区域主要基于V100,少数区域提供A100实例。中国莫得任何区域提供H100。全球其他地区仅有15个国度提供A100,唯有一个国度提供H100,其余的区域纯正基于V100。
此分析莫得讨论自界说加快芯片(如TPU),也莫得讨论不同区域内可用的GPU数目的各异。访谈信息提供者指出,不同区域内可用的同类型GPU数目可能在不同区域和提供商之间各异显耀。一位信息提供者指出:“超大畛域云服务提供商在诡计或存储方面险些给东说念主一种无所不可的印象,似乎不错处理你带来的任何问题。但这并不完全是现实。”在某些情况下,某一区域内可用的GPU数目可能相当有限,导致唯有有限数目的客户不错在该区域运行GPU实例,或者只可在合理的时辰内熟练较小畛域的模子。
面前以为AWS和Microsoft领有最大畛域的云GPU集群,但“在这方面,区域之间完全不调换”。不外,GPU数目偏执在提供商区域内的分散被超大畛域云提供商视为高度机密的信息。咱们的信息提供者中莫得东说念主景象或大略提供具体的数据,也无法指出如何公开获取这些信息。但渊博以为,好意思国地区的GPU数目可能比寰球其他领有同类GPU的区域要大得多。中国的区域可能也会有更多的V100芯片,以弥补其相对较低的性能。咱们的访谈标明,即使不错在此分析中纳入每个区域的GPU数目,这可能也不会挑战上述的主要模式,反而更可能强化这些模式。
为何蚁合在好意思国?
好意思国在先进的全球云AI诡计方面的越过上风相较于中国和其他国度,背后有什么原因?一个无庸赘述的解释是好意思国政府的出口照管,装束向中国出口A100和H100芯片。中国的云提供商在2023年出口照管奏效前,大略入口一些A100芯片,但H100自家具发布以来就一直受到出口照管。相通,H800和A800芯片在推出后不久也被纳入出口照管。性能远不如这些芯片的V100是中国最常见的Nvidia GPU实例类型,因为它不受出口照管的戒指。
关联词,出口照管无法解释为什么除了中国除外的其他国度也主要部署了旧款GPU。几种解释是可能的。一个浅薄的解释是改进扩散的摩擦,指的是GPU在市集上扩散的进程。较新的GPU可能起先被安设在好意思国,因为Nvidia总部位于好意思国,因此在好意思国的分销相聚最为刚劲。跟着时辰的推移,先进的GPU应该徐徐扩散到相对较远的市集。“我假定险些系数的GPU领先齐参加了北好意思区域,但面前欧洲应该也有了终点畛域的集群,炒股开户”一位信息提供者揣摸。
好意思国云诡计越过的另一个潜在解释来自于运转需求结构上的地舆各异,这与畛域经济相联结,酿成了一种“旅途依赖”,从而保管了AI诡计蚁合在某些地舆区域的景色。一位信息提供者解释说念:“很少有云诡计买家真实从事始创性的AI斥地......是以莫得必要在各地分散技能......你需要几个超等集群,酿成某些地点的诡计技能临界质地,没必要在每个地点复制这种技能。”
最早蚁合进行大畛域AI模子熟练的公司和研究东说念主员出面前好意思国,因此云提供商将最刚劲的熟练诡计技能蚁合在那里。但即便全球其他地点对诡计的需求在加多,这并不消然回荡为腹地诡计基础方法的相应增长,因为斥地东说念主员频频不错将熟练任务发送到好意思国的云区域,而不会遭受显耀的性能耗损。于是,好意思国领先的诡计越过地位得以捏续。
信息提供者以为,用于部署AI的诡计技能的情况有所不同。在许多AI用例中,举例语音助手,如若用户与服务器之间的距离过大,用户体验可能会受到蔓延的影响。数据传输成本也可能成为一个业务问题。因此,这类应用最佳部署在离用户更近的诡计基础方法上。这也解释了为什么性能不及以用于熟练的V100芯片——尽管速率较慢但仍适用于推理任务——在全球范围内的分散比更先进的芯片愈加均匀。
关联词,也有一些例外情况与好意思国领有首先进GPU的渊博模式不符。日本、英国和法国每个国度齐有与V100维持区域数目调换的A100维持区域。这些国度齐有显耀的腹地AI斥地行径。可能存在使腹地斥地者无法将数据发送到好意思国进行熟练的公法或政事艰辛。一位信息提供者指出:“面前,有些全球部门或进犯的欧洲参与者需要用无法离开欧洲的数据熟练GPT-4级别的模子......如若超大畛域云提供商莫得反应这一需求,我会感到骇怪。”
在这一配景下,信息提供者提到了研究“数字主权”、“数据主权”和“诡计主权”的政策商议,这可能会创造对腹地熟练诡计需求的加多。荷兰和爱尔兰也领有小而相对先进的GPU威望。这可能与这些国度看成一些超大畛域云提供商基础方法要道的战术地位研究。值得真贵的是,荷兰是好意思国除外唯独一个领有H100 GPU的云区域的国度。
独到和政府诡计的全球分散
本研究的要点是公有云诡计,这是一种进犯但并非唯独的诡计开首。在公有云诡计中,咱们的数据相聚蚁合于Nvidia的GPU和六大越过的超大畛域云服务提供商。
不同类型的大畛域诡计提供商的相对地位是否会发生变化,挑战刻下不雅察到的诡计地舆形态?GPU集群看成不菲的老本品,需要高应用率才能杀青合理的投资讲述率,这解释了为什么大畛域集群主要被构建为分享基础方法,无论是政府领有的(如科学超等诡计)也曾频年来独到的(如公有云)。政府领有的诡计似乎正以“国度AI诡计”盘算的方式在全球范围内进行小畛域总结。举例,好意思国的国度AI资源(NAIR)责任组旨在创建公有诡计基础方法以“民主化AI研究”(。关联词,许厚情况下政府的投资畛域似乎不及以真实挑战超大畛域云服务提供商的主导地位。许多最近的政府勤勉亦然在与这些超大畛域云服务商的合营下进行的,践诺上这些相貌依赖于独到基础方法。
欧洲高性能诡计汇注体的新LUMI超等诡计机提供了一个反例。LUMI位于芬兰Kajaani,由欧盟成员国政府合营树立,由Nvidia的竞争敌手AMD瞎想的11,912个GPU构成集群。其畛域可能会成为AI斥地基础方法方面独到“公有”云诡计基础方法的一个严肃替代有计算。鉴于它位于欧盟,它并未挑战图2中浮现的南北诡计鸿沟。关联词,它可能有助于冲破好意思中两国看成唯独AI超等大国的南北极形象。
新的独到诡计集群也在增长。Google的TPU可能占据了终点大比例的AI诡计。AWS和微软齐盘算分娩我方的芯片。Meta告示将大畛域投资修复独到诡计技能:首席实践官马克·扎克伯格宣称将投资34万颗Nvidia H100和A100。2023年,微软宣称破耗数亿好意思元用于为OpenAI的ChatGPT聊天机器东说念主提供能源的集群。大型科技公司可能仅凭其里面和合营伙伴的需求就能杀青大畛域集群的高应用率。但领先部署为独到的集群在里面需求减少后,可能诊断治为分享的云基础方法。这暧昧了独到和公有(如全球住房)云诡计技能之间的区别。
一起AI诡计的鸿沟
通过诡计来治理AI是一个有劲的理念,因为诡计由大型、可不雅察的物资基础方法构成。这些基础方法必须物理地位于某个地点,因此容易受到疆域统治权的影响,而疆域统治权是系数国度——不管大小——最具实践力的统治方式。关联词研究浮现,诡计基础方法并未均匀分散在全球各地,它们的地舆分散很猛进度上决定了不同国度将诡计看成AI滋扰点的可能性。
研究重现了两个AI超等大国堕入诡计“武备竞赛”的熟悉不雅点,其中好意思国在芯片质地点面占据上风,而中国试图通过数目来弥补差距。好意思国对先进GPU的出口戒指似乎起到了作用,因为莫得任何全球云提供商在中国提供2023年的H100芯片,也莫得提供为藏匿这些戒指而斥地的H800或A800。相通地,俄罗斯和伊朗这两个受西方制裁的国度在咱们的样本中也莫得任何全球云AI诡计方法。
关联词,除了地缘政事大国竞争的不雅点除外,研究还建议了与基于诡计的AI治理相干的其他主见类别。除了好意思国和中国除外,还有另外15个国度也领有对AI发展最为进犯的GPU,即A100和H100。这些第一梯队的国度,除了印度除外,均位于所谓的“全球朔方”。类比而言,将它们称为“诡计朔方”。这些诡计朔方国度不错应用其疆域统治权来滋扰AI发展,极度是在模子被发送到其腹地全球云区域进行熟练时。举例,它们不错条件算法和数据集在熟练出手之前通过审计并赢得适合腹地规定的认证,从而影响参加全球市集的AI系统的类型。
第二梯队包括13个国度,它们的诡计技能更妥贴AI系统的部署而非斥地。除了瑞士除外,这些国度齐位于全球南边,因此将它们称为“诡计南边”。举例,拉丁好意思洲共有五个GPU维持的云区域,但它们莫得一个配备了比2017年发布的V100更刚劲的GPU。这些国度大略应用其对诡计的疆域统治权来把关哪些AI系统不错在腹地部署,但对于AI系统斥地的影响较小。
除了“诡计朔方”和“诡计南边”,还有一个“诡计沙漠”,用此术语指代寰球上系数不具备任何全球云AI诡计(不管是用于熟练也曾部署)的国度。对于这些国度而言,转向基于云的AI服务意味着依赖于在异邦司法统治区内斥地和部署的基础方法。诡计沙漠包括一些富庶国度,但也包括国外货币基金组织(IMF)分类的系数中低收入国度和低收入国度。诡计沙漠国度的影响可能因其富庶进度而有所不同。沙漠中的富庶国度可能大略应用其其他上风——举例对诡计朔方国度的酬酢影响力以及足以修复政府领有的诡计技能的资产——来对消其衰退腹地全球云AI诡计的症结,但诡计沙漠中的浮泛国度险些莫得远景不错通过诡计治理来影响AI。
雷同于研究东说念主员不雅察到学术界和工业界之间存在“诡计鸿沟”,研究也不雅察到了全球诡计鸿沟,全球云AI诡计的地舆分散似乎在重现全球不对等的熟悉模式。从1990年代中期出手,研究数字化的商议建议,到手参加新的全球“常识经济”将基于常识和创造力等非物资资产,而不再依赖于工业经济期间所需的物资资产和资源。这意味着发展中国度不错跳过不菲的基础方法投资,平直参加基于常识的经济模式。关联词,今天对于AI的商议再次强调了芯片制造厂、数据中心和电力相聚等物资基础方法对于国度竞争力的症结作用。如若诡计成为一个症结的治理节点,那么这些物资基础方法可能也会被阐扬对于保捏安适的监管权利至关进犯(Lehdonvirta 2023)。因此,一个国度的诡计技能在某种进度上也等同于其政事权利。
这种情况会发生变化吗?如若高端AI诡计蚁合在好意思国和“诡计朔方”仅仅由于改进扩散进程中的摩擦所致,那么跟着时辰的推移,全球可能会逐步充满诡计技能,松开这种差距。Nvidia的竞争敌手,如AMD和英特尔,正在芯片性能方面追逐。中国厂商也在斥地AI处理芯片,而且由于好意思国的出口收敛,中国国内对其需求稠密,再加上政府的维持,这种差距可能会徐徐
然而,如若不雅察到的地舆模式更多是由先驱上风和畛域经济导致的旅途依赖解释的,那么地舆蚁合、区域专科化以及国外服务单干可能将成为诡计分娩的捏久特征,正如在许多其他行业中一样。
谁领有了最多的GPU?这个问题的谜底似乎早已呼之欲出,但在这一问题的背后,内容上是算力的不均匀分散。而如何改善算力的招架衡,让处于诡计萧疏的更多东说念主享受到AI所带来的便利,只怕短时辰内是很难惩办的了。
原文作家
原文由Vili Lehdonvirta、Bóxī Wú和Zoe Hawkins撰写。
半导体极品公众号保举
专注半导体领域更多原创内容
柔和全球半导体产业动向与趋势
*免责声明:本文由作家原创。著述内容系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或维持,如若有任何异议,接待研究半导体行业不雅察。
今天是《半导体行业不雅察》为您分享的第3887内容,接待柔和。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
心爱咱们的内容就点“在看”分享给小伙伴哦