來(lái)源:IT之家
12 月 11 日消息,AMD 早在 2021 年就制定了“到 2025 年將 EPYC 處理器和 Instinct 加速器的能效提高 30 倍”的目標(biāo)。
根據(jù) AMD 官方的說(shuō)法,雖然還沒(méi)到 2025 年,但他們現(xiàn)在距離這一成果已經(jīng)只差臨門(mén)一腳:配備最新 EPYC 9575F?和 Instinct MI300X 的機(jī)器相比?2020 年一臺(tái)未公開(kāi)的機(jī)器能效提高了 28.3 倍。
AMD 在測(cè)試中使用了?Llama3.1-70B(vLLM 0.6.1.post2、TP8 Parallel、FP8、連續(xù)批處理)模型,然后對(duì)比其推理性能的差異。
AMD 并未透露其測(cè)試中用到的這套 2020 年硬件規(guī)格,但很顯然基于?Zen 2 系列的 EPYC 7002 處理器(單個(gè) CPU 最多 64 核)以及基于初代 CDNA 架構(gòu)的 Instinct MI100 加速器。
AMD 還表示,除了“給力”的硬件提升之外,這一成績(jī)是通過(guò)架構(gòu)改進(jìn)和軟件優(yōu)化綜合實(shí)現(xiàn)的成果,這是可以預(yù)料到的結(jié)果。
該公司最近剛推出了基于 CDNA 3 架構(gòu)的 Instinct MI325X 加速器,配備了 288 GB HBM3E 內(nèi)存子系統(tǒng);AMD 明年還將推出基于 CDNA 4 架構(gòu)的 Instinct MI355X,與 MI325X 相比性能(FP8 和 FP16)將提高約 80%。
除了 FP8 和 FP16 外,MI325X 還將支持 FP4 和 FP6 格式,其峰值性能將達(dá)到 9.2 PetaFLOPS(FP4),這對(duì)于許多大語(yǔ)言模型來(lái)說(shuō)非常實(shí)用。也就是說(shuō),AMD 要想實(shí)現(xiàn)在 2025 年實(shí)現(xiàn)其計(jì)算平臺(tái)能效提高 30 倍的目標(biāo)并不難。
AMD 高級(jí)副總裁、AMD 公司研究員和產(chǎn)品技術(shù)架構(gòu)師 Sam Naffziger 表示,“通過(guò)我們對(duì)硬件和軟件協(xié)同設(shè)計(jì)中深思熟慮的方法,我們對(duì)實(shí)現(xiàn) 30x25 目標(biāo)很有信心,并對(duì)未來(lái)充滿期待,我們已經(jīng)看到了在未來(lái)幾年內(nèi)實(shí)現(xiàn)大幅能效提升的有效途徑。”
AI年末“狂歡”!OpenAI、谷歌、Meta、李飛飛發(fā)布重磅產(chǎn)品
澳門(mén)一碼一肖一特一中管家婆,重點(diǎn)含義落實(shí)-最新答案雷蒙德·朱迪思
新澳門(mén)資料大全免費(fèi)澳門(mén)資料大全,重點(diǎn)核心落實(shí)-最新答案肯尼迪·特雷西
澳門(mén)資料大全正版免費(fèi)資料,重點(diǎn)靈活解析-最新核心康奈爾·伊麗莎白
7777788888精準(zhǔn),重點(diǎn)核心關(guān)注-最新熱門(mén)伯恩·諾頓
澳門(mén)天天開(kāi)彩好正版掛牌,重點(diǎn)核心落實(shí)-最新答案迪克·愛(ài)默生
新澳今天最新資料99588,重點(diǎn)解答落實(shí)-最新核心泰勒·瓦倫丁
2024新澳彩料免費(fèi)資料,重點(diǎn)解釋定義-最新核心厄普頓·杜爾
還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...