亚洲精品成人福利网站,无码伊人66久久大杳蕉网站谷歌,亚洲变态另类天堂av手机版,性猛交富婆╳xxx乱大交小说,无码精品国产va在线观看dvd

站內(nèi)搜索 | 手機(jī)版

媒體界 - 推動(dòng)中國媒體行業(yè)創(chuàng)新，促進(jìn)業(yè)內(nèi)人士交流分享！

媒體界 > 行業(yè)縱橫 > 正文內(nèi)容

月之暗面Kimi攜手清華等巨頭，開源高性能大模型推理架構(gòu)Mooncake

發(fā)布時(shí)間：2024-11-28 14:11 來源：ITBEAR 作者：沈如風(fēng)

在科技界的一次重大合作中，月之暗面Kimi與清華大學(xué)MADSys實(shí)驗(yàn)室攜手，共同揭曉了他們醞釀已久的Mooncake推理系統(tǒng)設(shè)計(jì)方案。這一創(chuàng)新方案于2024年6月正式面世，其核心在于采用了KVCache為中心的PD分離技術(shù)和存換算架構(gòu)，極大地推動(dòng)了推理吞吐量的提升。

為了加快Mooncake技術(shù)的實(shí)際應(yīng)用步伐，近日，月之暗面Kimi與清華大學(xué)MADSys實(shí)驗(yàn)室再度發(fā)力，聯(lián)合9#AISoft、阿里云、華為存儲(chǔ)、面壁智能以及趨境科技等業(yè)界知名企業(yè)，共同推出了Mooncake開源項(xiàng)目。該項(xiàng)目旨在構(gòu)建一個(gè)以KVCache為核心的大模型推理架構(gòu)，進(jìn)一步推動(dòng)技術(shù)的普及與發(fā)展。

就在近日，Mooncake技術(shù)框架已經(jīng)正式在開源社區(qū)上線，為全球的開發(fā)者提供了一個(gè)全新的技術(shù)平臺(tái)。以下是Mooncake技術(shù)框架的開源地址：

Mooncake開源項(xiàng)目不僅是對(duì)其學(xué)術(shù)論文的延伸，更是對(duì)以超大規(guī)模KVCache緩存池為核心的創(chuàng)新理念的實(shí)踐。通過存換算這一創(chuàng)新思路，Mooncake顯著降低了算力開銷，從而實(shí)現(xiàn)了推理吞吐量的顯著提升。這一突破性的進(jìn)展，無疑為人工智能領(lǐng)域帶來了新的發(fā)展機(jī)遇。

在開源計(jì)劃的實(shí)施上，Mooncake采取了分階段推進(jìn)的策略。首先，將高性能KVCache多級(jí)緩存Mooncake Store的實(shí)現(xiàn)逐步開源，同時(shí)確保對(duì)各種推理引擎和底層存儲(chǔ)/傳輸資源的兼容性。目前，傳輸引擎Transfer Engine部分已經(jīng)率先在GitHub上實(shí)現(xiàn)了全球開源。

Mooncake開源項(xiàng)目的長遠(yuǎn)目標(biāo)是，為大模型時(shí)代打造一種高性能、內(nèi)存語義存儲(chǔ)的標(biāo)準(zhǔn)接口，并提供一套可參考的實(shí)現(xiàn)方案。這將為未來的技術(shù)發(fā)展奠定堅(jiān)實(shí)的基礎(chǔ)，推動(dòng)人工智能領(lǐng)域邁向新的高度。

通過Mooncake推理系統(tǒng)架構(gòu)圖，我們可以清晰地看到其設(shè)計(jì)的精妙之處。這一架構(gòu)不僅體現(xiàn)了技術(shù)的先進(jìn)性，更展示了合作團(tuán)隊(duì)在人工智能領(lǐng)域的深厚底蘊(yùn)和創(chuàng)新能力。

更多>同類內(nèi)容

三星繪圖助手：文字指令下的圖像創(chuàng)作新紀(jì)元

02-12

新春開跑！壽光外貿(mào)企業(yè)全力沖刺“開門紅”

02-12

《百日戰(zhàn)紀(jì)-最終防衛(wèi)學(xué)園-》4月24日登陸Steam與Switch，真相待揭！

02-12

平安債券ETF組合表現(xiàn)搶眼，資金青睞布局債市新機(jī)遇

02-12

古茗港股上市，美團(tuán)龍珠押中開年最大新茶飲IPO！

02-12

四川首發(fā)經(jīng)濟(jì)熱潮涌動(dòng)，首店首秀激發(fā)消費(fèi)新活力！

02-12

AI板塊搶眼，科創(chuàng)板系列指數(shù)午盤飄紅，科技ETF成布局良機(jī)？

02-12

Wiz報(bào)告：DeepSeek帶動(dòng)自托管AI熱潮，數(shù)據(jù)安全風(fēng)險(xiǎn)成焦點(diǎn)

02-12

豆包大模型UltraMem：推理成本大降，性能超越MoE架構(gòu)

02-12

小米智能攝像機(jī)3云臺(tái)版：安全芯加持，AI偵測讓家居更安全

02-12

2024產(chǎn)品安全報(bào)告：AMD固件漏洞數(shù)是Intel4.4倍，NVIDIA高危漏洞也不少

02-12

《怪物獵人：荒野》將上線，Switch 2能否承載卡普空的期待？

02-12

《怪物獵人：荒野》蜘蛛恐懼癥模式上線，史萊姆能否成為玩家新寵？

02-12

《哪吒之魔童鬧?！泛Ｍ馐軣崤酰狈科?0億，躋身全球亞洲電影前25！

02-12

鴻海精密或接盤雷諾日產(chǎn)股份，汽車行業(yè)巨變在即？

02-12

點(diǎn)擊查看更多 +

全站最新

《GTA6》開發(fā)追求完美，玩家放心：AI難替人類創(chuàng)造力

《GTA6》開發(fā)追求完美，玩家放心：AI難替人類創(chuàng)造力

三星繪圖助手：文字指令下的圖像創(chuàng)作新紀(jì)元

三星繪圖助手：文字指令下的圖像創(chuàng)作新紀(jì)元

2025手機(jī)國補(bǔ)攻略：如何領(lǐng)取購新補(bǔ)貼，操作流程詳解！

2025手機(jī)國補(bǔ)攻略：如何領(lǐng)取購新補(bǔ)貼，操作流程詳解！

佰維X570 PRO天啟4TB評(píng)測：PCIe5.0“滿血”性能，存儲(chǔ)新選擇！

佰維X570 PRO天啟4TB評(píng)測：PCIe5.0“滿血”性能，存儲(chǔ)新選擇！

華為小藝助手網(wǎng)頁版上線：手機(jī)PC都能用，AI功能全面升級(jí)！

華為小藝助手網(wǎng)頁版上線：手機(jī)PC都能用，AI功能全面升級(jí)！

長安飛行汽車曝光：8懸臂16旋翼，最大航程30公里，未來十年千億投入

長安飛行汽車曝光：8懸臂16旋翼，最大航程30公里，未來十年千億投入

微博橙V認(rèn)證門檻大調(diào)整，閱讀量要求降至30萬引熱議

微博橙V認(rèn)證門檻大調(diào)整，閱讀量要求降至30萬引熱議

聯(lián)想拯救者Pro34來襲：240Hz OLED超感曲面屏，游戲新體驗(yàn)？

聯(lián)想拯救者Pro34來襲：240Hz OLED超感曲面屏，游戲新體驗(yàn)？

熱門內(nèi)容

本欄最新

三星繪圖助手：文字指令下的圖像創(chuàng)作新紀(jì)元

三星繪圖助手：文字指令下的圖像創(chuàng)作新紀(jì)元

新春開跑！壽光外貿(mào)企業(yè)全力沖刺“開門紅”

新春開跑！壽光外貿(mào)企業(yè)全力沖刺“開門紅”

《百日戰(zhàn)紀(jì)-最終防衛(wèi)學(xué)園-》4月24日登陸Steam與Switch，真相待揭！

《百日戰(zhàn)紀(jì)-最終防衛(wèi)學(xué)園-》4月24日登陸Steam與Switch，真相待揭！

平安債券ETF組合表現(xiàn)搶眼，資金青睞布局債市新機(jī)遇

平安債券ETF組合表現(xiàn)搶眼，資金青睞布局債市新機(jī)遇

古茗港股上市，美團(tuán)龍珠押中開年最大新茶飲IPO！

古茗港股上市，美團(tuán)龍珠押中開年最大新茶飲IPO！

四川首發(fā)經(jīng)濟(jì)熱潮涌動(dòng)，首店首秀激發(fā)消費(fèi)新活力！

四川首發(fā)經(jīng)濟(jì)熱潮涌動(dòng)，首店首秀激發(fā)消費(fèi)新活力！

AI板塊搶眼，科創(chuàng)板系列指數(shù)午盤飄紅，科技ETF成布局良機(jī)？

AI板塊搶眼，科創(chuàng)板系列指數(shù)午盤飄紅，科技ETF成布局良機(jī)？

Wiz報(bào)告：DeepSeek帶動(dòng)自托管AI熱潮，數(shù)據(jù)安全風(fēng)險(xiǎn)成焦點(diǎn)

Wiz報(bào)告：DeepSeek帶動(dòng)自托管AI熱潮，數(shù)據(jù)安全風(fēng)險(xiǎn)成焦點(diǎn)

媒體界微信：netspread（注明:媒體界）媒體界使命：推動(dòng)中國媒體行業(yè)創(chuàng)新，促進(jìn)業(yè)內(nèi)人士交流分享！
Copyright ? 2016-2023 mws.com.cn All rights reserved. 魯ICP備11015305號(hào)

<style id="zhe1o"></style>