让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

顶牛贷
你的位置:英赫优配 > 顶牛贷 > 亚马逊芯片的高明火器
亚马逊芯片的高明火器
发布日期:2024-09-18 08:46    点击次数:76

(原标题:亚马逊芯片的高明火器)

如若您但愿不错常常碰头,迎接标星保藏哦~

起首:内容编译自IEEE,谢谢。

头部处理器厂商,尤其是面向云霄东说念主工智能的处理器制造商,如AMD和Nvidia,如故推崇出想顺次有更多联想业务的迹象,它们收购了软件、互连和处事器制造商。他们但愿对“全栈”的律例能让他们联想出客户想要的居品。

亚马逊网罗处事 (AWS)于 2015 年收购了芯片联想公司 Annapurna Labs,并出手以垂直整合的方式联想 CPU、AI 加速器、处事器和数据中心,从而率先于大多数竞争敌手。8 月27 日,Graviton 系列 CPU 的技能认真东说念主Ali Saidi和 Annapurna Labs 的工程总监Rami Sinno解释了垂直整合联想和亚马逊畛域的上风,并向IEEE Spectrum先容了该公司位于德克萨斯州奥斯汀的硬件测试实验室。

两东说念主聊到了对于垂直整合的云公司需要什么样的工程师、Graviton 系列 CPU 的演变经由、AWS 的芯片联想有何不同,以及实验室位置若何加速联想等话题。

Q

Rami,是什么促使你加入亚马逊网罗处事?

Rami Sinno:亚马逊是我的第一家垂直整合公司。这是突出而为之。我那时在Arm责任,正在寻找下一次冒险,商量行业的发展场合以及我但愿留住什么。我商量了两件事:

一种是垂直整合的公司,因为大多数革命皆在这里——当你律例好意思满的硬件和软件堆栈并顺利请托给客户时,事理的事情就会发生。

第二件事是,我意志到机器学习,总的来说是东说念主工智能,将会变得特地特地苍劲。我不知说念它到底会朝哪个场合发展,但我知说念有些东西将会改变一代东说念主,我想成为其中的一员。我之前就有过这么的资格,那时我参与了制造黑莓芯片的团队;这是行业的一次根人道转化。成为如斯伟大、如斯根蒂的东西的一部分,那种嗅觉简直太棒了。我想,“好吧,我又有契机成为这个根人道事物的一部分了。”

Q

在垂直整合的公司责任是否需要不同类型的芯片联想工程师?

Rami Sinno:诚然。当我招聘职工时,口试经由会寻找具有这种心态的东说念主。让我举一个具体的例子:假定我需要又名信号好意思满性工程师。(信号好意思满性确保信号从 A 点到 B 点,不管它在系统中的哪个位置,皆能正确地到达那边。)庸碌,您会遴聘在信号好意思满性分析方面领有丰富劝诫、了解布局影响、不祥在实验室进行测量的信号好意思满性工程师。但这对咱们团队来说还不够,因为咱们但愿咱们的信号好意思满性工程师也能成为顺次员。咱们但愿他们不祥承担在系统级别运行的责任负载或测试,并不祥对其进行修改或重新出手构建一个新的,以便在责任负载下搜检系统级别的信号好意思满性影响。这即是采纳生动、跳出念念维定势的培训的地方,这对咱们进行开发的方式和处事客户的方式产生了高大的酬劳。

归根结底,咱们的拖累是顺利在数据中心为咱们的客户提供好意思满的处事器。如若你从这个角度念念考,你将不祥在统共这个词堆栈中进行优化和革命。联想工程师或测试工程师应该不祥纵不雅全局,因为这是他们的责任,将好意思满的处事器请托给数据中心,并寻找最好优化点。它可能不在晶体管级别、基板级别或电路板级别。它可能是统统不同的东西。它可能结净是软件。领有这些学问和可见性,将使工程师的责任后果显耀擢升,请托给客户的速率显耀加速。咱们不会为了优化晶体管而枉操神思,因为卑鄙的三行代码就不错处治这些问题,对吧?

Q

您觉适当今的东说念主们皆是受到这么的查验吗?

Rami Sinno:咱们在应届大学毕业生方面特地运道。最近的大学毕业生,尤其是当年几年的毕业生,推崇特地出色。我对西席系统培养的工程师和联想机科学家对咱们为他们提供的责任类型感有趣有趣的方式感到特地特地舒坦。

咱们在寻找合适东说念主才方面特地告成的另一个地方是初创公司。他们知说念需要什么,因为从界说上讲,在初创公司,你必须作念好多不同的事情。也曾创业过的东说念主统管辖略亚马逊的文化和念念维方式。

Q

Ali,您为什么加入 AWS?

Ali Saidi:我来这里简短七年半了。加入 AWS 时,我加入了一个高明容貌。有东说念主告诉我:“咱们将构建一些 Arm 处事器。不要告诉任何东说念主。”

咱们从 Graviton 1 出手。Graviton 1 本色上是咱们解释不错使用不同架构在 AWS 中提供疏导体验的器用。

云联想让咱们不祥让客户以特地低老本、低门槛的方式尝试,并说“它相宜我的责任负载吗?”是以 Graviton 1 本色上仅仅解释咱们不错作念到这少许的器用,并出手向天下发出信号,咱们但愿围绕 ARM 处事器的软件不祥发展,况兼它们将变得愈加迫切。

Graviton 2 于 2019 年发布,是咱们的第一款居品......咱们以为它是一款商场率先的开发,针对通用责任负载、Web 处事器和诸如斯类的东西。

它作念得很好。咱们有东说念主运行数据库、Web 处事器、键值存储和许多应用顺次……当客户遴荐 Graviton 时,他们会带来一个责任负载,况兼他们看到了带来这个责任负载的公正。然后他们问的下一个问题是,“好吧,我想带来更多的责任负载。我应该带来什么?”有些地方它不够苍劲,止境是在媒体编码、拍摄视频并对其进行编码或再行编码或将其编码为多个流等方面。这是一个特地悉力的数学运算,需要更多的 [单教导多数据] 带宽。咱们需要不祥进行更多数学运算的内核。

咱们还但愿股东 [高性能联想] 商场的发展。因此,咱们有一种称为 HPC 7G 的实例类型,咱们的客户包括一级方程式赛车队。他们联想流体能源学,商量这辆车将若何扰动空气,以及这会若何影响背面的汽车。这本色上仅仅扩大了应用顺次组合。当咱们使用 Graviton 4 时,咱们也作念了相同的事情,它有 96 个中枢,而 Graviton 3 唯有 64 个。

Q

你若何知说念从一代到下一代需要纠正什么?

Ali Saidi:活着界各地,大多数客户在遴荐 Graviton 时皆取得了高大的告成。偶尔,他们看到的性能与其他迁徙不同。他们可能会说“我搬动了这三个应用顺次,性能擢升了 20%;这很棒。但我把这个应用顺次移到这里,性能莫得任何擢升。为什么?”看到 20% 真的很棒。但对我来说,以我这种奇怪的方式来说,0% 本色上更事理,因为它给了咱们一些不错和他们一说念去探索的东西。

咱们的大多数客户皆对此类配合合手特地怒放作风。因此,咱们不错了解他们的应用顺次是什么,顶牛贷并为其构建某种代理。或者,如若是里面责任负载,那么咱们不错只使用原始软件。然后,咱们不错应用它来完成闭环,并商量下一代 Graviton 将具有哪些功能,以及咱们将如安在那边达成更好的性能。

Q

在 AWS 联想芯片有何不同?

Ali Saidi:在芯片联想中,有许多不同的竞争优化点。咱们常常濒临一些相互突破的需求,比如老本、更动、功耗、大小、哪些 DRAM 技能可用以及你何时将它们相交……最终,这是一个事理、多方面的优化问题,需要找出在一定时辰内不错构建的最好居品。你需要把它作念好。

咱们作念得特地好的一件事即是将咱们的运转硅片过问分娩。

Q

若何作念到的?

Ali Saidi:和其他公司软硬件团队很少交流不同,Annapurna 和 AWS 的硬件东说念主员和软件东说念主员从第一天起就一说念责任。软件东说念主员编写最终将成为分娩软件和固件的软件,而硬件则与硬件工程师配合开发。通过配合,咱们正在关闭迭代轮回。当你把硬件带到软件工程师的办公桌上时,你的迭代轮回将合手续数年。在这里,咱们握住地迭代。在准备好硅片之前,咱们会在模拟器中运行捏造机。咱们正在模拟 [一个好意思满的系统] 并运行咱们要运行的大多数软件。

因此,当咱们从代工场拿回硅蓦的,软件就如故完成了。现时,咱们如故看到大多数软件皆能平常责任。因此,咱们特地有信心,它一定会告成。

我以为,另一个身分即是统统专注于咱们要请托的内容。你有好多观点,但你的联想资源险些是固定的。不管我把若干观点放进桶里,我皆无法雇佣那么多东说念主,而且我的预算可能亦然固定的。是以我放进桶里的每一个观点皆会使用一些资源。如若这个功能对容貌标告成并不迫切,那么我即是在拿容貌标其余部分冒险。我以为这是东说念主们常常犯的一个造作。

Q

在垂直整合的情况下,这些有谋划是否更容易?

Ali Saidi:诚然。咱们知说念咱们想要制造的居品是什么形状,需要哪些功能。咱们不会试图制造一个企图进入多个商场的超集居品,违反的是,咱们专注于一个商场。

Q

AWS 芯片联想环境还有什么独到之处?

Ali Saidi:AWS 一个特地事理的方面是,咱们是云,咱们也在云中开发这些芯片。咱们是第一家信得过股东在云中运行 [电子联想自动化 (EDA)] 的公司。咱们将模式从“我有 80 台处事器,这是我用于 EDA 的”改为“今天,我有 80 台处事器。如若我情景,来日我不错有 300 台。第二天,我不错有 1,000 台。”

咱们不错通过改变所使用的资源来压缩一些时辰。在容貌出手时,咱们不需要那么多资源。咱们不错关闭好多东西,而不消为此付出有用的代价。当咱们接近容貌终端时,当今咱们需要更多的资源。而不是说:“好吧,我无法快速迭代,因为我有一台机器,而且它很忙。”我不错改变这少许,改为说:“好吧,我不想要一台机器;我今天要有 10 台机器。”

对于这种大型联想,迭代周期蓝本是两天,以致一天,有了这 10 台机器,我不错将其缩小到三到四个小时。这简直太棒了。

Q

对于客户来说,Amazon.com 有多迫切?

Ali Saidi:他们有无数的责任量,而咱们彰着是消释家公司,因此咱们不错通过第三方无法取得的方式造访其中一些责任量。但咱们也与其他外部客户保合手着特地密切的联系。

上一次 Prime Day,咱们说有 2,600 项 Amazon.com 处事在 Graviton 处理器上运行。本年 Prime Day,这一数字增多了一倍多,达到 5,800 项处事在 Graviton 上运行。亚马逊零卖部门在 Prime Day 时间使用了进步 250,000 个 Graviton CPU 来撑合手零卖网站偏激斟酌处事。

Q

AI 加速器团队与测试从芯片到处事器机架等统共开发的实验室位于消释地点,为什么?

Rami Sinno:Annapurna Labs 在多个地点也有多个实验室。这个地点在奥斯汀……是较小的实验室之一。但奥斯汀实验室的事理之处在于,统共硬件和许多机器学习处事器、Trainium和Inferentia [AWS 的 AI 芯片] 的软件开发工程师皆有用地聚首在这一层。对于硬件开发东说念主员和工程师来说,将实验室聚首在消释层楼特地特地有用。它加速了请托给客户的实验和迭代速率。这个实验室的树立是为了自力餬口,知足咱们需要作念的任何责任,不管是在芯片级、处事器级照旧主板级。因为正如我向咱们的团队传达的那样,咱们的责任不是芯片;咱们的责任不是主板;咱们的责任是向客户提供好意思满的处事器。

Q

垂直整合若何匡助您联想和测试用于数据中心畛域部署的芯片?

Rami Sinno:创建一台擢升程序的处事器相对容易。性能特地高、功耗特地低。如若咱们创建 10 个、100 个以致 1,000 个这么的处事器,这很容易。你不错挑选这个,不错树立这个,不错树立阿谁。但 AWS 的畛域要大得多。咱们需要查验需要 100,000 个芯片的模子。100,000 个!而且对于查验来说,它不是在五分钟内运行的。它需要数小时、数天以致数周的时辰。这 100,000 个芯片必须在统共这个词经由中保合手运行。咱们在这里所作念的一切皆是为了达到这少许。

咱们从“哪些事情可能出错?”的心态出手。咱们实施咱们知说念的统共事情。关联词当你褒贬云畛域时,总会有一些你莫得料想的事情出现。这些皆是 0.001% 类型的问题。

在这种情况下,咱们首先在车队中进行调试。在某些情况下,咱们必须在实验室中进行调试以找到根蒂原因。如若咱们能立即树立,咱们会立即树立。由于是垂直整合的,在许厚情况下,咱们不错对其进行软件树立。咱们应用咱们的敏捷性来快速树立,同期确保下一代从一出手就如故处治了这个问题。

https://spectrum.ieee.org/amazon-ai

半导体极品公众号保举

专注半导体领域更多原创内容

赞佩大家半导体产业动向与趋势

*免责声明:本文由作家原创。著述内容系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或撑合手,如若有任何异议,迎接斟酌半导体行业不雅察。

今天是《半导体行业不雅察》为您共享的第3887内容,迎接赞佩。

『半导体第一垂直媒体』

及时 专科 原创 深度

公众号ID:icbank

可爱咱们的内容就点“在看”共享给小伙伴哦