亞馬遜云科技深夜拋出“王炸”：文生/視頻生等6款大模型發(fā)布，推出基于自研Trn2 AI芯片的最強(qiáng)AI服務(wù)器

發(fā)布時(shí)間：2024-12-04 11:22 來源：鈦媒體APP 作者：鐘景軒

安迪·賈西發(fā)布Amazon Nova系列模型

亞馬遜云科技深夜拋出“王炸”，不僅一口氣推出6款大模型，Amazon用于深度學(xué)習(xí)和生成式AI場景，基于自研芯片的最強(qiáng)EC2實(shí)例也來了。

大模型方面，Amazon Nova系列基礎(chǔ)模型包括Micro、Lite、Pro、Premier四款。其中，Micro為純文本模型，128k上下文窗口；Lite和Pro為多模態(tài)模型，300k上下文窗口；Premier也為多模態(tài)模型，可用于執(zhí)行復(fù)雜的推理任務(wù)。亞馬遜CEO安迪·賈西（Andy Jassy）在介紹時(shí)透露，Micro、Lite和Pro模型已全面開放可用，Premier模型會將于2025年第一季度推出。

“要是將它（Pro模型）與GPT-4 O進(jìn)行比較，在20個(gè)基準(zhǔn)測試中的17個(gè)上相等或更優(yōu)，和Gemini對比，在21個(gè)基準(zhǔn)測試中的16個(gè)上相等或更優(yōu)?！辟Z西介紹。他也強(qiáng)調(diào)了四款模型的成本效益很高，相較于Amazon Bedrock中的其他領(lǐng)先模型，Nova能便宜大約75%。

四款基礎(chǔ)模型不僅集成在Amazon Bedrock中，還與Amazon Bedrock里的所有功能進(jìn)行了深度整合，任何模型提供商都可以使用并供開發(fā)者進(jìn)行微調(diào)。Nova模型還與蒸餾功能整合，可將大模型的智能“轉(zhuǎn)移”到更小的模型中，這些小模型成本效益更高，延遲更低。

另外，賈西也宣布推出了圖像生成模型Amazon Nova Canvas及視頻生成模型Amazon Nova Real。其中，Amazon Nova Real即將推出可以制作6秒視頻的功能，未來幾個(gè)月內(nèi)，還會推出能夠制作最長2分鐘視頻的功能。

亞馬遜云科技CEO馬特·加爾曼（Matt Garman）也在現(xiàn)場宣布，Amazon Bedrock multi-agent collaboration多智能體協(xié)作功能同步推出，這意味著Amazon Bedrock智能體能夠處理復(fù)雜的工作流程?！岸鄠€(gè)智能體返回了信息，它還能進(jìn)行協(xié)調(diào)處理，確保所有這些智能體之間能夠有效協(xié)作。”馬特表示。

馬特·加爾曼宣布推出基于Trn2的EC2實(shí)例

繼AI大模型公司Anthropic宣布下一代Claude模型將在Amazon Project Rainier上進(jìn)行訓(xùn)練，并產(chǎn)生擁有數(shù)十萬個(gè)Amazon Tranium2 芯片的亞馬遜集群之后，馬特當(dāng)?shù)貢r(shí)間12月3日上午便宣布推出由Amazon Trainium2提供支持的Amazon Elastic Compute Cloud （Amazon EC2）實(shí)例，新的Trn2 UltraServer、下一代 Trainium3 芯片也同步推出。

“今天，我很高興地宣布Amazon EC2 Trn2實(shí)例正式可用，這些實(shí)例由Trainium2芯片提供支持。Amazon EC2 Trn2實(shí)例是我們?yōu)樯墒紸I設(shè)計(jì)的最強(qiáng)大的實(shí)例，這都得益于這些完全由亞馬遜云科技內(nèi)部定制構(gòu)建的處理器?！瘪R特在現(xiàn)場表示。

據(jù)鈦媒體App了解，基于Amazon Trainium2的Amazon EC2實(shí)例，能夠訓(xùn)練和部署當(dāng)今最新的AI模型以及未來的大型語言模型（LLM）和基礎(chǔ)模型（FM）。與當(dāng)前一代基于 GPU 的 EC2 P5e 和 P5en 實(shí)例相比，Trn2 實(shí)例的性價(jià)比提高了 30-40%，并具有 16 個(gè) Trainium2 芯片，可提供 20.8 petaflops 的峰值計(jì)算能力，非常適合訓(xùn)練和部署具有數(shù)十億個(gè)參數(shù)的 LLM。

Amazon Trainium2芯片

Amazon EC2 Trn2實(shí)例服務(wù)器托架

對于需要更多計(jì)算的最大模型，Trn2 UltraServer 允許客戶將訓(xùn)練擴(kuò)展到單個(gè) Trn2 實(shí)例的限制之外，從而減少訓(xùn)練時(shí)間，加快上市時(shí)間，并支持快速迭代以提高模型準(zhǔn)確性。Trn2 UltraServer 是一種全新的 EC2 產(chǎn)品，它使用超快的 NeuronLink 互連將四臺 Trn2 服務(wù)器連接在一起形成一臺巨型服務(wù)器，可擴(kuò)展至 83.2 petaflops 的峰值計(jì)算能力，將單個(gè)實(shí)例的計(jì)算、內(nèi)存和聯(lián)網(wǎng)能力提高四倍，從而能夠訓(xùn)練和部署世界上最大的模型。

借助新的 Trn2 UltraServer，客戶可以跨 64 個(gè) Trainium2 芯片擴(kuò)展其生成式 AI 工作負(fù)載。對于推理工作負(fù)載，客戶可以使用 Trn2 UltraServer 來提高生產(chǎn)中萬億參數(shù)模型的實(shí)時(shí)推理性能。

“Trainium2 專為支持最大、最前沿的生成式 AI 工作負(fù)載而構(gòu)建，用于訓(xùn)練和推理，并在 AWS 上提供最佳性價(jià)比，”亞馬遜云科技計(jì)算和網(wǎng)絡(luò)副總裁 David Brown 說?！半S著模型接近數(shù)萬億個(gè)參數(shù)，我們了解客戶還需要一種新穎的方法來訓(xùn)練和運(yùn)行這些龐大的工作負(fù)載。新的 Trn2 UltraServer 在 AWS 上提供最快的訓(xùn)練和推理性能，并幫助各種規(guī)模的組織以更快的速度和更低的成本訓(xùn)練和部署世界上最大的模型。

以AI大模型公司Anthropic 為例，Claude系列大模型讓Anthropic 在全球備受關(guān)注。AI大模型公司Anthropic聯(lián)合創(chuàng)始人兼首席計(jì)算官Tom Brown當(dāng)?shù)貢r(shí)間12月2日宣布，公司旗下下一代的Claude模型將在Project Rainier上進(jìn)行訓(xùn)練，他表示這將是一個(gè)新的亞馬遜集群，擁有數(shù)十萬個(gè)Amazon Tranium2 芯片。優(yōu)化完成后，該集群預(yù)計(jì)將成為迄今為止世界上最大的 AI 計(jì)算集群，可供 Anthropic 構(gòu)建和部署其未來模型。

“數(shù)十萬個(gè)芯片意味著數(shù)百個(gè)密集的億次浮點(diǎn)運(yùn)算，比我們曾經(jīng)使用過的任何集群都多五倍以上。這意味著客戶將可以更低的價(jià)格、更快的速度獲得更多的智能。有了 Amazon Tranium2 和 Project Rainier，我們不僅僅是在構(gòu)建更快的人工智能，還在構(gòu)建可擴(kuò)展的、值得信賴的人工智能?！盩om Brown表示。此前一周亞馬遜宣布追加對Anthropic的第二筆40億美元的投資（目前共計(jì)亞馬遜投資80億美元），進(jìn)一步深化兩家公司在人工智能領(lǐng)域的合作，加快Anthropic的發(fā)展。

同日，亞馬遜云科技也推出了專為滿足生成式 AI 工作負(fù)載而設(shè)計(jì)的下一代AI訓(xùn)練芯片Trainium3 芯片，Trainium3 將成為第一款采用 3 納米工藝節(jié)點(diǎn)制造的 Amazon 芯片，為性能、能效和密度設(shè)定了新標(biāo)準(zhǔn)。由 Trainium3 提供支持的 UltraServer 的性能預(yù)計(jì)將比 Trn2 UltraServer 高 4 倍，使客戶能夠在構(gòu)建模型時(shí)更快地迭代，并在部署模型時(shí)提供卓越的實(shí)時(shí)性能。第一批基于 Trainium3 的實(shí)例預(yù)計(jì)將于 2025 年底推出。（本文首發(fā)于，作者 | 秦聰慧）?

更多>同類內(nèi)容