DoNews9月20日消息,美國加州時間9月19日上午,英特爾在美國加州圣何塞發(fā)布最新處理器Meteor Lake,也就是年中公布的酷睿Ultra處理器首款產(chǎn)品。Meteor Lake基于Intel 4制程工藝打造,也是英特爾迄今為止能效最高的PC處理器,新增分離式模塊架構(gòu)設(shè)計。
AI能力再升級
從第10代酷睿中首次引入AI開始,英特爾開啟了PC端AI應(yīng)用落地的新階段,加速生態(tài)在PC端AI應(yīng)用的探索。其次,第12代酷睿處理器中英特爾推出了高性能混合架構(gòu),憑借性能核、能效核的組合,讓PC面對更復(fù)雜應(yīng)用場景時可以靈活平衡性能與能耗,也是x86處理器在過去最重要的變革之一。
AI+高性能架構(gòu)促使英特爾在邊緣計算,AI能力成為主要發(fā)展方向。
2023年中旬,英特爾宣布酷睿品牌升級煥新,拆分為旗艦級的全新英特爾酷睿Ultra、主流級的英特爾酷睿。其中,Meteor Lake是“首款酷睿Ultra”處理器,首批Meteor Lake將是面向筆記本電腦的處理器,預(yù)計2024年第一季度有品牌上出貨。而英特爾14代酷睿桌面級處理器預(yù)計10月亮相。
Meteor Lake采用全新分離式模塊架構(gòu),分別是計算模塊、SoC模塊、圖形模塊、IO模塊,并通過英特爾Foveros 3D封裝技術(shù)連接。
計算模塊仍舊是高性能混合架構(gòu),擁有全新微架構(gòu)的性能核(Redwood Cove)與能效核(Crestmont)均首次采用了Intel 4制程工藝,能效進一步提升。為了讓計算單元模塊化,英特爾優(yōu)化了環(huán)形總線等設(shè)計。
SoC模塊
全新的SoC模塊Meteor Lake低功耗設(shè)計的關(guān)鍵,集成全新低功率計算島E-core,人工智能加速引擎NPU,內(nèi)存控制器,連接模塊,媒體處理計算單元,顯示輸出單元等。SoC模塊可以支持Wi-Fi 6E、Wi-Fi 7,支持8K HDR和AV1編碼,支持原生HDMI 2.1和DP 2.1標準,支持全新DDR內(nèi)存規(guī)格。
SoC模塊是Meteor Lake中相比以往最大的改變之一,也是Meteor Lake全新設(shè)計的樞紐。英特爾提到,Meteor Lake中SoC模塊基于對性能、能效的追求,在架構(gòu)設(shè)計方面有四個原則:第一,重新劃分計算密集型IP,從而優(yōu)化功耗,在不影響性能的情況下,致力于提高能效比。第二,擴展I/O,滿足SoC內(nèi)部主要IP所需要的帶寬。第三,引入低能耗核心。第四,充足電源管理算法。
具體來看,以往處理器內(nèi)部設(shè)計中,媒體編解碼器和GPU在一起,并通過環(huán)形總線與CPU聯(lián)合起來,如果媒體編解碼器運行,就需要GPU進入“工作狀態(tài)”,并需要通過環(huán)形總線訪問內(nèi)存,盡管屬于高性能解決方案,卻也有一項缺點——當環(huán)形總線上任何區(qū)塊訪問內(nèi)存時,都必須激活環(huán)形總線、CPU、GPU單元,功耗更高。也就是說,由于架構(gòu)設(shè)計原因,當用戶播放流媒體時,整個模塊都在運行,不利于節(jié)能。
到了Meteor Lake,媒體引擎和圖形拆分開,包括計算模塊,都有獨立在SoC總線上的位置,并且內(nèi)存控制器也放到了SoC總線上。也就是說,無論是哪個區(qū)塊、核心訪問內(nèi)存,其余部分不需要供電,例如在視頻播放中只需要媒體編輯碼、顯示供電,其他部分可以關(guān)閉,由此帶來了視頻播放的功耗優(yōu)化。
SoC模塊另一個值得重點介紹的就是引入低功率計算島E-core,這也是Meteor Lake支持超低功耗的“秘密武器”。憑借SoC模塊上這個功耗非常低、工作頻率非常低的能效核,Meteor Lake在處理流媒體播放、常規(guī)控制等輕負載時,不再需要使用計算模塊中的性能核、能效核,大幅減低功耗。
超低功耗能效核再加上計算模塊的能效核、性能核,組成了全新“3D高性能混合架構(gòu)”,讓Meteor Lake相比此前的12代、13代酷睿支持更出色的線程調(diào)度、性能以及功耗平衡。所以,Meteor Lake在更多應(yīng)用場景中,帶來的節(jié)能特性,續(xù)航優(yōu)化將非常值得期待。
首次集成NPU
從第10代酷睿將AI引入PC,英特爾就開始加速AI在終端側(cè)落地。如今我們看到,AI正在加速從云端向終端側(cè)遷移,英特爾提出了這一趨勢背后的四大驅(qū)動因素——第一,終端側(cè)AI算力越來越強,如果將AI放在云端,那么作為后端的云端將容易成為瓶頸,難以大規(guī)模發(fā)展;第二,AI部輸在云端將給服務(wù)提供商帶來更多成本;第三,AI在終端側(cè)部署延時更低,即使沒有網(wǎng)絡(luò)也能使用;第四,數(shù)據(jù)存放在終端側(cè),可以更好地保護用戶隱私。
在Meteor Lake中,英特爾首次集成神經(jīng)網(wǎng)絡(luò)處理單元(NPU),并且全系支持,更進一步提升終端側(cè)AI能效及應(yīng)用。
CPU、GPU、NPU都可以提供AI算力,但是針對不同使用場景匹配程度并不相同,例如CPU適合處理輕量級AI,GPU適合需要高性能、高吞吐量AI應(yīng)用,NPU則專為AI設(shè)計具備高能效、低功耗等優(yōu)勢。
所以Meteor Lake在加入NPU后,能夠在PC端提供高效的人工智能加速引擎,與CPU、GPU結(jié)合更靈活的應(yīng)對不同場景下AI算力需求。值得一提的是,NPU低功耗特性尤其適合長時間運行的AI應(yīng)用,比如在視頻會議場景中涉及長時間的背景虛化、任務(wù)追蹤等等需求,NPU加入后可以降低對CPU、GPU調(diào)用,從而讓輕薄本等設(shè)備提供更持久的續(xù)航。
例如,在英特爾的內(nèi)部測試中,將負載全部跑在CPU上用時為43.3秒,功耗40W;全部跑在GPU上用時為14.5秒,功耗37W;將部分負載(Unet+與Unet-)交由NPU執(zhí)行,其余交由CPU執(zhí)行,用時為20.7秒,功耗10W;Unet+由GPU執(zhí)行,Unet-由NPU執(zhí)行,用時為11.3,功耗為30W。
可以看到通過靈活調(diào)用NPU、CPU、GPU,面對同一負載可以在兼顧功耗的情況下提升效率。英特爾表示,加入NPU后相對僅CPU而言,效率可以提升8倍。
NPU集成兩個神經(jīng)計算引擎,可以共同處理單一工作負載或各自處理不同工作負載。在神經(jīng)計算引擎中,主要集成推理管道、SHAVE DSP兩個組件。
推理管道:高能效計算的核心驅(qū)動因素,通過最大限度地減少數(shù)據(jù)移動并利用固定功能運作來處理常見的大計算量任務(wù),可以在神經(jīng)網(wǎng)絡(luò)執(zhí)行中實現(xiàn)高效節(jié)能。絕大多數(shù)計算發(fā)生在推理管道上,這個固定功能管道硬件支持標準的神經(jīng)網(wǎng)絡(luò)運作。該管道由一個乘積累加運算( MAC)陣列、一個激活功能塊和一個數(shù)據(jù)轉(zhuǎn)換塊組成。
SHAVE DSP:一款專為AI設(shè)計的高度優(yōu)化 VLIW DSP(超長指令字/數(shù)字信號處理器)。流式混合架構(gòu)向量引擎(SHAVE )可以與推理管道和直接內(nèi)存訪問(DMA)引擎一起進行管道化,實現(xiàn)在NPU上并行進行的真正異構(gòu)計算,從而最大限度地提高性能。DMA引擎能夠優(yōu)化編排數(shù)據(jù)移動,實現(xiàn)最高能效和性能。
此外NPU中還集成主機接口和設(shè)備管理——設(shè)備管理區(qū)支持微軟計算驅(qū)動程序模型(MCDM),可以讓Meteor Lake的NPU確保安全性的同時更好地支持MCDM;內(nèi)存管理單元(MMU)提供多種情況下的隔離,并支持電源和工作負載調(diào)度,實現(xiàn)快速地低功率狀態(tài)轉(zhuǎn)換。
不僅是在芯片設(shè)計、底層架構(gòu)方面的創(chuàng)新,英特爾在AI領(lǐng)域的持續(xù)布局已經(jīng)構(gòu)建出了軟硬件協(xié)同的完善生態(tài)。例如在應(yīng)用層面,英特爾攜手合作伙伴打造了視頻增強及美化、視頻背景模糊、超分辨率、語音降噪等應(yīng)用。
英特爾表示,現(xiàn)在已經(jīng)有超過100家合作伙伴共同推動終端側(cè)AI應(yīng)用。同時,英特爾也與微軟緊密合作,包括針對微軟Office辦公全家桶的探索;專門運行在NPU上的“Windows Studio Effects”,可以簡化、降低軟件開發(fā)者使用AI的門檻;對接AI應(yīng)用的底層框架Direct ML,實現(xiàn)英特爾平臺上獲得更高能效。
圖形模塊
Meteor Lake集成基于Xe LPG架構(gòu)打造的英特爾ARC銳炫顯卡,堪稱“集顯中提供獨顯性能”,性能是前代的2倍,并支持Intel XeSS以及DX12 Ultimate。
Meteor Lake的圖形模塊優(yōu)化了緩存互連,擁有8個GPU核心、128個Vector Engines,幾何圖形渲染管線大幅提升,并且新增8個硬件光追單元、亂序采樣功能,進一步增加準確率和性能。
IO模塊
IO模塊集成了Thunderbolt 4和PCIe 5.0,提供出色連接體驗,保證數(shù)據(jù)傳輸效率。
這里還要介紹英特爾硬件線程調(diào)度器。在英特爾推出高性能混合架構(gòu)后,這項技術(shù)就在持續(xù)助力酷睿平臺更靈活、高效地釋放性能。
Meteor Lake增強了英特爾硬件線程調(diào)度器對操作系統(tǒng)的反饋,新的硬件線程調(diào)度器會實時更新核心能力,以便更加精準地向操作系統(tǒng)報告整個核心和每個核心的內(nèi)部能耗比的評估和判斷,以提供更加精確的表格給到操作系統(tǒng)。同時在軟件層面和系統(tǒng)層面,與英特爾DDT軟件結(jié)合起來對核心調(diào)配做更優(yōu)的控制。
Intel 4制程工藝與Foveros封裝技術(shù)
Meteor Lake或許是英特爾發(fā)布12代酷睿,推出高性能混合架構(gòu)后在酷睿平臺上最重要的一次變革,但除了創(chuàng)新的架構(gòu)外,還擁有兩點值得關(guān)注——Intel 4制程工藝以及Foveros封裝技術(shù)。
“四年五節(jié)點”是英特爾重要的發(fā)展戰(zhàn)略,也是能否重新奪回制程工藝領(lǐng)先地位的關(guān)鍵一步。根據(jù)英特爾的IDM 2.0戰(zhàn)略,英特爾計劃在四年內(nèi)實現(xiàn)五個制程節(jié)點,2024年在制程節(jié)點上與對手平齊,并于2025年處于領(lǐng)先地位。Intel 4是第二個節(jié)點,將為Intel 3奠定基礎(chǔ)。
根據(jù)英特爾公布的信息,與Intel 7相比實現(xiàn)了2倍面積微縮,帶來了高性能邏輯庫,且性能核能效比提升20%。Intel 4的創(chuàng)新特性還包括——方管采用EUV光刻技術(shù),簡化制造流程;采用高密度MIM(金屬-絕緣體-金屬)電容器保證出色供電性能;實現(xiàn)更好頻率、電壓平衡。
目前Intel 4處理器正在加速量產(chǎn)中。
Meteor Lake將采用Foveros封裝技術(shù),F(xiàn)overos封裝技術(shù)的優(yōu)勢包括:36u凸點間距,跡線寬度小于1微米;凸點密度提高近8倍;跡線長度小于2毫米;160GB/s/mm帶寬;功耗小于0.3pJ/位。
采用Foveros封裝的Meteor Lake與Raptor Lake相比,具備的優(yōu)勢包括:低功耗晶片互連最大限度地減少分區(qū)開銷;小區(qū)塊提高了晶圓良率,初制晶圓更少;能夠為每個區(qū)塊選擇理想的硅工藝;簡化SKU創(chuàng)建,提高定制能力。
英特爾也介紹了封裝Meteor Lake的流程,包括五個步驟。
第一、切割:從晶圓廠收到內(nèi)部和外部代工廠的晶圓,并將其切割成單個芯片。
第二、分選和Diet測試:單晶片測試確保只有高質(zhì)量晶片才能進入Foveros組裝階段。這種探測能力是異構(gòu)設(shè)計的關(guān)鍵所在,通過向組裝生產(chǎn)線提供更多高質(zhì)量芯片來提高測試良率。組裝生產(chǎn)線已經(jīng)過主動熱控制能力全面測試。
第三、晶圓組裝:在基板晶圓上組裝各個模塊。該生產(chǎn)線在一個流程中整合了芯片附著、底部填充和晶圓模具等組裝操作,以及碰撞、鈍化、研磨、拋光等制造操作,這在英特爾尚屬首次。
第四、封裝組裝: Meteor Lake Foveros復(fù)合體是在BGA基板面上組裝的。這種復(fù)合體兼容現(xiàn)有的封裝組裝工具和工藝,只需進行少許優(yōu)化。
第五、測試和完成:英特爾HDMx和系統(tǒng)測試保障質(zhì)量,包括壓力和老化測試、類測試和系統(tǒng)級平臺測試。
寫在最后
2023年英特爾給Meteor Lake又賦予了更多AI能力,PC將迎來新的拐點。Meteor Lake將更高效也更節(jié)能,保證體驗的同時為筆記本提供更長時間的續(xù)航,這也是全新SoC模塊最重要的作用之一。對于應(yīng)用場景更加復(fù)雜多元化的PC而言,這項特性可以更好地兼顧生產(chǎn)力和效率。