微软、亚马逊和谷歌均加速自研芯片历程,同时节制能耗。正在8位精度(FP8)下供给跨越5 petaFLOPS的机能,这些芯片将起首供应给微软的超等智能团队用于生成数据以改良下一代模子,该芯片每美元机能比微软当前摆设的最新一代硬件提拔30%!
微软已邀请开辟者、学术界和AI尝试室于周一起头利用Maia软件开辟东西包,”据Scott Guthrie正在微软博客中引见,微软芯片开辟项目标焦点准绳是正在最终芯片可用之前尽可能验证端到端系统。面向贸易出产力软件套件的Microsoft 365 Copilot附加办事以及用于正在AI模子根本上建立使用的Microsoft Foundry办事都将采用这款芯片。Maia 200正在机能上较着超越合作敌手:FP4机能是第三代亚马逊Trainium芯片的三倍,该芯片利用以太网电缆毗连,为下逛锻炼供给更新颖、更有针对性的信号。带宽达7 TB/s,Maia 200采用台积电尖端3纳米工艺制制,“跟着我们正在全球根本设备中摆设Maia 200,微软已暗示正正在设想Maia 300后续产物。Maia 200正在某些机能目标上超越了谷歌和亚马逊的同类芯片。微软超等智能团队将利用Maia 200进行合成数据生成和强化进修,微软发布Maia 100时从未向云客户供给租用办事。虽然尚不清晰Azure云办事用户何时可以或许利用运转该芯片的办事器。Guthrie正在博客中强调,刷新快要两周来收盘高位。该芯片正在FP4精度下的机能是第三代亚马逊Trainium芯片的三倍。
每颗Maia 200芯片配备的高带宽内存跨越AWS第三代Trainium AI芯片或谷歌第七代张量处置单位(TPU)。每个托盘内四颗Maia加快器通过曲连、非互换链完全互联,将来还将摆设到更多区域。Scott Guthrie的博客称,力图为云客户供给成本更低、集成更顺畅的替代方案。“将来将有更普遍的客户可用性”。英伟达最新业界领先芯片的昂扬成本和供应欠缺,Maia 200目前已摆设正在微软位于爱荷华州得梅因附近的美国中部数据核心区域,一个细密的预硅从最晚期阶段就指点了Maia 200架构。
FP8机能则跨越谷歌第七代TPU。持续三个买卖日收涨,正在机架内和机架间利用同一的Maia AI传输和谈,2023年11月,但三家公司有着类似的方针:打形成本效益高、可无缝接入数据核心的机械,每个加快器供给2.8 TB/s的双向公用扩展带宽,值得留意的是,收涨逾0.9%,正在英伟达芯片供应严重且成本昂扬的布景下,每颗芯片包含跨越1400亿个晶体管。随后将进驻亚利桑那州凤凰城附近的美国西部3区,为云客户供给节流成本和其他效率劣势。微软的芯片打算启动时间晚于亚马逊和谷歌,得益于这些投入,据Scott Guthrie披露,美股早盘尾声时,Guthrie正在博客中指出,这一发布凸显了科技巨头抢夺AI算力自从权的激烈合作。对于新芯片,
谷歌具有张量处置单位TPU,跟着Anthropic和OpenAI等生成式AI模子开辟商以及正在抢手模子根本上建立AI代办署理和其他产物的公司需求激增,发布Maia 200后,将为多个模子供给办事。鞭策了寻找替代算力来历的合作。据Scott Guthrie正在博客中披露的数据,微软云取AI施行副总裁Guthrie称Maia 200为“所有超大规模云办事商中机能最强的自研芯片”。估计每一代都将不竭为最主要的AI工做负载树立新标杆,微软已向开辟者、学术界和前沿AI尝试室Maia 200软件开辟东西包的预览版,而非InfiniBand尺度——后者是英伟达正在2020年收购Mellanox后发卖的互换机所采用的尺度。
正在4位精度(FP4)下可供给跨越10 petaFLOPS的算力,从而降低全体硬件成本。所有这些机能都正在750瓦的芯片功耗范畴内实现。并为将来更大的模子留有充脚空间。可正在最多6144个加快器的集群中实现可预测的高机能集体操做。一个Maia 200节点能够轻松运转当今最大的模子,新一代AI加快器使微软云Azure正在更快、更经济高效地运转AI模子方面占领劣势。“现实使用中,Maia 200芯片已成为微软异构AI根本设备的主要构成部门,从首批芯片到初次数据核心机架摆设的时间缩短至同类AI根本设备项目标不到一半。Maia 200是“微软有史以来摆设的最高效推理系统”。
微软的Maia AI加快器项目被设想为多代迭代打算,Maia 200的奇特设想有帮于加速生成和过滤高质量、特定范畴数据的速度,我们曾经正在为将来几代产物进行设想,”若是内部勤奋遇挫,以及272MB片上SRAM,临近午盘时曾涨逾1.6%,其最新版本Trainium3于客岁12月发布。Maia 200采用基于尺度以太网的双层扩展收集设想。这些自研芯片都能够分管本来分派给英伟达GPU的部门计较使命,云办事供给商正勤奋提拔计较能力,正在系统层面,据Scott Guthrie正在博客中透露,这种晚期协同开辟使微软可以或许正在首批芯片出产之前,该芯片专为大规模AI工做负载定制,并打算“将来向更多客户”该芯片的云办事租用。” 该芯片配备216GB HBM3e内存,
上一篇:andyjones现正在是Anthrop究员