僅僅半年之后,AI PC 就要迎來(lái)了一輪大幅度的升級。在之前關(guān)于 AMD 銳龍 AI 300 系列的報道中,雷科技就提到了 AMD 新款 AI PC 芯片在 NPU 算力的飛躍,以及高通、AMD 和英特爾之間的全新競爭。而在高通、AMD 之后,英特爾終于也帶來(lái)了下一代筆記本電腦芯片。6 月 4 日,英特爾在臺北電腦展上展示了最新一代的 Lunar Lake 處理器,并計劃在秋 季正式出貨。坦白講,這個(gè)發(fā)布節奏對比 AMD 和高通顯然要「慢」上不少,首批搭載驍龍 X 系列芯片的 Windows 11 AI PC 很快就將在 618 上市,搭載 AMD 銳龍 AI 300 系列的 Windows 11 AI PC 也將從 7 月起陸續上市。俗話(huà)說(shuō)「好飯不怕晚」。但問(wèn)題是,英特爾的 Lunar Lake 會(huì )是一碗「好飯」嗎?英特爾已經(jīng)放言,Lunar Lake「絕對」超越高通同類(lèi)產(chǎn)品(其實(shí)就是驍龍 X 系列芯片),然而就現在來(lái)說(shuō),我們肯定不會(huì )得到一個(gè)明確的答案。
但從目前公開(kāi)和流出的信息來(lái)看,Lunar Lake 至少是值得期待的,不僅因為全面提升的 CPU、GPU、NPU 性能,也因為用上了臺積電的先進(jìn)制造工藝以及自己的先進(jìn)封裝工藝。
甚至在 Lunar Lake 上,英特爾第一次將 LPDDR5X 內存封裝在芯片之中,就像蘋(píng)果的統一內存架構一般。但這種設計能給 Lunar Lake 帶來(lái)什么變化和升級?Lunar Lake 又能給下一代 AI PC 帶來(lái)什么?這些都是英特爾要在幾個(gè)月后要正式回答的。
去年,英特爾宣稱(chēng)酷睿 Ultra(Meteor Lake)處理器代表了該公司 40 年來(lái)最大的一次架構轉變,但面對 Arm 芯片的持續挑戰,這種轉變顯然不會(huì )是一次性的。在 Lunar Lake 上,英特爾繼續采用了 SoC 的設計,在一塊芯片中集成了 CPU、GPU、NPU 計算模塊。不同的是,Lunar Lake 沒(méi)有采用英特爾自己的芯片制造工藝,而是用上了臺積電 N3B 和臺積電 N6 兩種工藝來(lái)打造。在一定程度上,這是一種升級,畢竟是用上了目前最先進(jìn)的臺積電 3nm 工藝。要指出的是,N3B 作為臺積電 3nm 的第一代工藝,在蘋(píng)果 A17 Pro 上并沒(méi)有帶來(lái)大幅的能效提升。不過(guò)對比英特爾的先進(jìn)工藝就另說(shuō)了,按照英特爾自己的說(shuō)法,Lunar Lake 的能效提升了約 30%。而在性能方面,Lunar lake 配備了全新的 CPU 和 GPU 架構,CPU 性能提升了約 20%,GPU 性能更是提升了 50%,尤其在 3DMark Time Spy 等基準測試中提升更為明顯。
具體來(lái)說(shuō),新的 CPU 設計增強了分支預測、指令并行度和緩存帶寬,使得處理器在處理多任務(wù)和計算密集型任務(wù)時(shí)有更好的表現。原來(lái)酷睿 Ultra 采用的 3D 性能混合架構也改了,英特爾在 Lunar Lake 上砍掉了 LP-E 核設計,用上了新的 4x4 設計,也就是說(shuō),Lunar Lake 現在配備了 4 個(gè) P 核、4 個(gè) E 核。同時(shí) Lunar Lake 上不支持超線(xiàn)程,意味著(zhù) Lunar Lake 的線(xiàn)程數量和核心數量一樣都是 8。按照英特爾的說(shuō)法,與之前的 LP-E 核相比,Lunar Lake 的 E 核(Skymont)在同性能下的功耗只有前者的三分之一,同功耗下的單線(xiàn)程和多線(xiàn)程性能則有前者 2 倍和 4 倍。另一邊,P 核(Lion Cove)的 IPC 提高了 14%。
此外,在 Windows 11「containment zones」的基礎上,Lunar Lake 可以通過(guò)線(xiàn)程指令使用異構調度策略,將工作負載(比如 Copilot 助手等應用)導向功耗更低的 E 核,來(lái)實(shí)現節省電量的目的;或者是導向性能更高的 P 核,實(shí)現更流暢地運行。簡(jiǎn)單來(lái)說(shuō),現在 Lunar Lake 可以將特定任務(wù)細化到分配給不同策略的核心,做到更高匹配度和更高效率的運行。GPU 方面,Lunar Lake 采用了下一代 Xe2 架構,不僅性能有了平均 50%的提升,而且和 Xe 架構一樣具有高度的可擴展性,即可以集成在低功耗的移動(dòng) SoC 上,也將用在稍晚即將推出的 Arc 顯卡上。同時(shí),GPU 還能提供高達 67TOPS 的 AI 算力。
AI PC 這個(gè)概念,可以說(shuō)最初就是英特爾主導的,隨后也被整個(gè) PC 行業(yè)所共同介紹。但公允地講,英特爾現售的 AI PC 芯片酷睿 Ultra 在很多方面難以支撐「AI PC」的概念,除了 Windows 系統沒(méi)有跟上之外,AI 算力也是基礎因素之一。好在,Lunar Lake 也迎來(lái)了一波 AI 性能大升級。英特爾宣稱(chēng),Lunar Lake 處理器的 NPU 達到了 48TOPS 的 AI 性能,相比酷睿 Ultra 上的 NPU 算力提升了四倍不止。作為對比,新一代筆記本電腦芯片中,驍龍 X 系列的 NPU 算力是 45TOPS,銳龍 AI 300 系列的 NPU 算力是 50TOPS。
爾此外,在異構計算下,NPU 加上 CPU 的 5TOPS、GPU 的 67TOPS,Lunar Lake 處理器整體能夠提供高達 120TOPS 的算力。不過(guò)在小雷看來(lái),筆記本電腦受限于續航,異構計算更多承擔的是臨時(shí)性的重負載 AI 任務(wù)。而要將生成式 AI 技術(shù)應用到 PC 的基礎體驗之中,則必須充分利用起低功耗高 AI 性能的 NPU。這其實(shí)也是微軟在下一代 Windows 11 AI PC 的標準中著(zhù)重強調 40TOPS 以上算力的關(guān)鍵原因。所以從這個(gè)角度來(lái)看,就算是 NPU 我們也不能只看最高算力,還要看功耗表現。不過(guò),這一點(diǎn)還是要以后續的實(shí)際測試為準。而除了算力,影響 AI 實(shí)際運行表現的其實(shí)還有內存。我們都知道,現在很多時(shí)候限制 AI 實(shí)際運行表現的并非計算,而是傳輸,更直接地說(shuō)是內存帶寬和延遲。當然,往大了說(shuō),內存的改進(jìn)也會(huì )影響 CPU 以及 GPU 的實(shí)際表現,從而影響設備的整體性能。這可能也是為什么,英特爾選擇在 Lunar Lake 中直接封裝了內存。
在主題演講上,當英特爾 CEO 帕特·基辛格(Pat Gelsinger)手持展示 Lunar Lake 的時(shí)候,所有人都注意到了:Lunar Lake 還封裝了兩顆內存。
作為英特爾首款采用封裝內存的芯片,Lunar Lake 有 16GB 和 32GB(雙通道)LPDDR5X 兩種配置,單芯片運行速度高達 8533MT/s。該內存支持 16bx4 通道,與傳統的 PCB 嵌入式設計相比,PHY 功耗降低了 40%,面積節省了 250 平方毫米。在當下,這種設計我們已經(jīng)不陌生了,比如消費級中蘋(píng)果 M 系列芯片就采用了統一內存架構,此外,英偉達的高端加速卡如 H100、B200 都是直接將內存(包括 HBM)焊在 GPU 和 CPU 旁邊,封裝成一個(gè)芯片。這樣做的好處也非常明顯,首先是可以顯著(zhù)提升數據傳輸速度和系統響應時(shí)間。內存與處理器之間的距離縮短,大大減少了數據傳輸的延遲,提升整體系統性能。這對于需要高帶寬和低延遲的應用,例如圖形處理、AI 計算和高性能計算任務(wù),尤為重要。
其次是有助于降低功耗。同樣因為傳輸距離縮短,也減少了數據傳輸過(guò)程中的能量損耗,同時(shí)配合更先進(jìn)的制造工藝,有助于延長(cháng)設備的續航,特別適用于移動(dòng)設備和筆記本電腦 。再有,在芯片里封裝內存也可以簡(jiǎn)化主板布局,減少主板上的元件和連接。這不僅減少了生產(chǎn)成本,還提高了系統的可靠性。更緊湊的設計使得設備在重量和體積上有所減少,進(jìn)一步提升了便攜性。這對于超薄筆記本和移動(dòng)設備來(lái)說(shuō),同樣是一個(gè)重要的優(yōu)勢。
版權所有 ? 東莞市康納電子科技有限公司 技術(shù)支持: 商友科技