安迪·賈西發(fā)布Amazon Nova系列模型
亞馬遜云科技深夜拋出“王炸”,不僅一口氣推出6款大模型,Amazon用于深度學(xué)習(xí)和生成式AI場景,基于自研芯片的最強(qiáng)EC2實(shí)例也來了。
大模型方面,Amazon Nova系列基礎(chǔ)模型包括Micro、Lite、Pro、Premier四款。其中,Micro為純文本模型,128k上下文窗口;Lite和Pro為多模態(tài)模型,300k上下文窗口;Premier也為多模態(tài)模型,可用于執(zhí)行復(fù)雜的推理任務(wù)。亞馬遜CEO安迪·賈西(Andy Jassy)在介紹時(shí)透露,Micro、Lite和Pro模型已全面開放可用,Premier模型會將于2025年第一季度推出。
“要是將它(Pro模型)與GPT-4 O進(jìn)行比較,在20個(gè)基準(zhǔn)測試中的17個(gè)上相等或更優(yōu),和Gemini對比,在21個(gè)基準(zhǔn)測試中的16個(gè)上相等或更優(yōu)?!辟Z西介紹。他也強(qiáng)調(diào)了四款模型的成本效益很高,相較于Amazon Bedrock中的其他領(lǐng)先模型,Nova能便宜大約75%。
四款基礎(chǔ)模型不僅集成在Amazon Bedrock中,還與Amazon Bedrock里的所有功能進(jìn)行了深度整合,任何模型提供商都可以使用并供開發(fā)者進(jìn)行微調(diào)。Nova模型還與蒸餾功能整合,可將大模型的智能“轉(zhuǎn)移”到更小的模型中,這些小模型成本效益更高,延遲更低。
另外,賈西也宣布推出了圖像生成模型Amazon Nova Canvas及視頻生成模型Amazon Nova Real。其中,Amazon Nova Real即將推出可以制作6秒視頻的功能,未來幾個(gè)月內(nèi),還會推出能夠制作最長2分鐘視頻的功能。
亞馬遜云科技CEO馬特·加爾曼(Matt Garman)也在現(xiàn)場宣布,Amazon Bedrock multi-agent collaboration多智能體協(xié)作功能同步推出,這意味著Amazon Bedrock智能體能夠處理復(fù)雜的工作流程?!岸鄠€(gè)智能體返回了信息,它還能進(jìn)行協(xié)調(diào)處理,確保所有這些智能體之間能夠有效協(xié)作。”馬特表示。
馬特·加爾曼宣布推出基于Trn2的EC2實(shí)例
繼AI大模型公司Anthropic宣布下一代Claude模型將在Amazon Project Rainier上進(jìn)行訓(xùn)練,并產(chǎn)生擁有數(shù)十萬個(gè)Amazon Tranium2 芯片的亞馬遜集群之后,馬特當(dāng)?shù)貢r(shí)間12月3日上午便宣布推出由Amazon Trainium2提供支持的Amazon Elastic Compute Cloud (Amazon EC2)實(shí)例,新的Trn2 UltraServer、下一代 Trainium3 芯片也同步推出。
“今天,我很高興地宣布Amazon EC2 Trn2實(shí)例正式可用,這些實(shí)例由Trainium2芯片提供支持。Amazon EC2 Trn2實(shí)例是我們?yōu)樯墒紸I設(shè)計(jì)的最強(qiáng)大的實(shí)例,這都得益于這些完全由亞馬遜云科技內(nèi)部定制構(gòu)建的處理器?!瘪R特在現(xiàn)場表示。
據(jù)鈦媒體App了解,基于Amazon Trainium2的Amazon EC2實(shí)例,能夠訓(xùn)練和部署當(dāng)今最新的AI模型以及未來的大型語言模型(LLM)和基礎(chǔ)模型(FM)。與當(dāng)前一代基于 GPU 的 EC2 P5e 和 P5en 實(shí)例相比,Trn2 實(shí)例的性價(jià)比提高了 30-40%,并具有 16 個(gè) Trainium2 芯片,可提供 20.8 petaflops 的峰值計(jì)算能力,非常適合訓(xùn)練和部署具有數(shù)十億個(gè)參數(shù)的 LLM。
Amazon Trainium2芯片
Amazon EC2 Trn2實(shí)例服務(wù)器托架
對于需要更多計(jì)算的最大模型,Trn2 UltraServer 允許客戶將訓(xùn)練擴(kuò)展到單個(gè) Trn2 實(shí)例的限制之外,從而減少訓(xùn)練時(shí)間,加快上市時(shí)間,并支持快速迭代以提高模型準(zhǔn)確性。Trn2 UltraServer 是一種全新的 EC2 產(chǎn)品,它使用超快的 NeuronLink 互連將四臺 Trn2 服務(wù)器連接在一起形成一臺巨型服務(wù)器,可擴(kuò)展至 83.2 petaflops 的峰值計(jì)算能力,將單個(gè)實(shí)例的計(jì)算、內(nèi)存和聯(lián)網(wǎng)能力提高四倍,從而能夠訓(xùn)練和部署世界上最大的模型。
借助新的 Trn2 UltraServer,客戶可以跨 64 個(gè) Trainium2 芯片擴(kuò)展其生成式 AI 工作負(fù)載。對于推理工作負(fù)載,客戶可以使用 Trn2 UltraServer 來提高生產(chǎn)中萬億參數(shù)模型的實(shí)時(shí)推理性能。
“Trainium2 專為支持最大、最前沿的生成式 AI 工作負(fù)載而構(gòu)建,用于訓(xùn)練和推理,并在 AWS 上提供最佳性價(jià)比,”亞馬遜云科技計(jì)算和網(wǎng)絡(luò)副總裁 David Brown 說?!半S著模型接近數(shù)萬億個(gè)參數(shù),我們了解客戶還需要一種新穎的方法來訓(xùn)練和運(yùn)行這些龐大的工作負(fù)載。新的 Trn2 UltraServer 在 AWS 上提供最快的訓(xùn)練和推理性能,并幫助各種規(guī)模的組織以更快的速度和更低的成本訓(xùn)練和部署世界上最大的模型。
以AI大模型公司Anthropic 為例,Claude系列大模型讓Anthropic 在全球備受關(guān)注。AI大模型公司Anthropic聯(lián)合創(chuàng)始人兼首席計(jì)算官Tom Brown當(dāng)?shù)貢r(shí)間12月2日宣布,公司旗下下一代的Claude模型將在Project Rainier上進(jìn)行訓(xùn)練,他表示這將是一個(gè)新的亞馬遜集群,擁有數(shù)十萬個(gè)Amazon Tranium2 芯片。優(yōu)化完成后,該集群預(yù)計(jì)將成為迄今為止世界上最大的 AI 計(jì)算集群,可供 Anthropic 構(gòu)建和部署其未來模型。
“數(shù)十萬個(gè)芯片意味著數(shù)百個(gè)密集的億次浮點(diǎn)運(yùn)算,比我們曾經(jīng)使用過的任何集群都多五倍以上。這意味著客戶將可以更低的價(jià)格、更快的速度獲得更多的智能。有了 Amazon Tranium2 和 Project Rainier,我們不僅僅是在構(gòu)建更快的人工智能,還在構(gòu)建可擴(kuò)展的、值得信賴的人工智能?!盩om Brown表示。此前一周亞馬遜宣布追加對Anthropic的第二筆40億美元的投資(目前共計(jì)亞馬遜投資80億美元),進(jìn)一步深化兩家公司在人工智能領(lǐng)域的合作,加快Anthropic的發(fā)展。
同日,亞馬遜云科技 也推出了專為滿足生成式 AI 工作負(fù)載而設(shè)計(jì)的下一代AI訓(xùn)練芯片Trainium3 芯片,Trainium3 將成為第一款采用 3 納米工藝節(jié)點(diǎn)制造的 Amazon 芯片,為性能、能效和密度設(shè)定了新標(biāo)準(zhǔn)。由 Trainium3 提供支持的 UltraServer 的性能預(yù)計(jì)將比 Trn2 UltraServer 高 4 倍,使客戶能夠在構(gòu)建模型時(shí)更快地迭代,并在部署模型時(shí)提供卓越的實(shí)時(shí)性能。第一批基于 Trainium3 的實(shí)例預(yù)計(jì)將于 2025 年底推出。(本文首發(fā)于,作者 | 秦聰慧)?