北京時間12月12日對英特爾來說大事連連,在北京,正舉辦20歲生日的英特爾中國研究院的隔壁樓房著了大火,而遠在大洋彼岸,英特爾在加州Los
Altos舉辦的“架構(gòu)日”上連發(fā)大招!
英特爾高管、架構(gòu)師和院士們展示了下一代技術(shù),并介紹了英特爾在驅(qū)動不斷擴展的數(shù)據(jù)密集型工作負載方面的戰(zhàn)略進展,從而為PC和其他智能消費設(shè)備、高速網(wǎng)絡(luò)、人工智能(AI)、云數(shù)據(jù)中心和自動駕駛汽車提供支持。
英特爾不僅展示了一系列處于研發(fā)中的基于10納米的系統(tǒng),將用于PC、數(shù)據(jù)中心和網(wǎng)絡(luò)設(shè)備,并預覽了其他針對更廣泛工作負載的技術(shù),還一連分享了聚焦于六個工程領(lǐng)域的技術(shù)戰(zhàn)略,包括:
1、先進的制造工藝和封裝。
2、可加速人工智能(AI)和圖形等專門任務(wù)的新架構(gòu)。
3、超高速內(nèi)存。
4、超微互連。
5、嵌入式安全功能。
6、為開發(fā)者統(tǒng)一和簡化基于英特爾計算路線圖進行編程的通用軟件。
英特爾表示,對這些領(lǐng)域的重大投資和技術(shù)創(chuàng)新,將為更加多元化的計算時代奠定了基石,到2022年,潛在市場規(guī)模將超過3000億美元。
英特爾高級副總裁:摩爾定律將長存!
本次架構(gòu)日的舉辦地加州Los Altos是仙童半導體與英特爾的聯(lián)合創(chuàng)始人Robert
Noyce的故居,該活動由英特爾公司處理器核心與視覺計算高級副總裁Raja Koduri與英特爾公司高級副總裁兼硅工程事業(yè)部總經(jīng)理Jim
Keller擔任主講。
Jim
Keller一出場就懟了所謂摩爾定律大限將至的說法,他表示,在他看完整個英特爾的技術(shù)布局之后,深覺得他能夠發(fā)揮的空間極大,他會讓摩爾定律在未來很長的一段時間內(nèi)持續(xù)下去,要大跌那些評論家的眼鏡。
英特爾公司高級副總裁兼硅工程事業(yè)部總經(jīng)理JimKeller
Raja則認為如今數(shù)據(jù)產(chǎn)生速度已遠遠超過出現(xiàn)有基礎(chǔ)設(shè)施所能處理的速度,因此未來亟需更高效、規(guī)模更大且更具可擴展性的計算架構(gòu)。根據(jù)現(xiàn)場媒體的報道,Raja預言說,未來10年計算架構(gòu)的發(fā)展將遠超過過去50年的速度。
Raja提到,由于計算產(chǎn)業(yè)的轉(zhuǎn)變,未來英特爾在架構(gòu)設(shè)計上也會越來越靈活,不但核心本身的設(shè)計會更接地氣,同時也將更強調(diào)不同場景的計算適配,未來將引入CPU、GPU以外更多的計算概念,構(gòu)成xPU生態(tài)。
基于不同時代所需要的計算架構(gòu)不同,Raja將整個計算軌跡分為三個階段,分別是2000年左右的GHz時鐘速度階段、2005年開始的多核階段,以及未來的架構(gòu)階段,未來架構(gòu)將是主導整個計算市場的最主要核心。Raja表示,英特爾將針對三大計算領(lǐng)域布局更廣的計算架構(gòu),包括CPU和GPU在內(nèi)的這些架構(gòu)都將混合更多元、更具彈性的計算能力。
英特爾公司處理器核心與視覺計算高級副總裁Raja Koduri
針對AI應(yīng)用這一當下和未來的主流計算趨勢,英特爾也會在其主力架構(gòu)中增加更多包含深度學習、訓練以及推理計算加速的功能區(qū)塊。
其下一代 14nm 處理器Cooper Lake將引進 AI 模型訓練加速能力,支持 bfloat16的數(shù)據(jù)格式,可達到比
fp32高兩倍的數(shù)據(jù)輸出能力。
Raja還大秀英特爾在CPU以及GPU方面的最新布局,并展示未來英特爾CPU的核心發(fā)展路線,剖析了整個計算市場的走向。他也介紹了其最新的 Gen 11
世代繪圖核心,并表示會將規(guī)模持續(xù)做大,設(shè)計出更符合全方位計算與繪圖應(yīng)用的獨立GPU架構(gòu),正面迎擊AMD與英偉達。
此外,存儲、封裝以及服務(wù)器的技術(shù)布局均在Raja本次全面介紹的射程之中。
作為xPU系列中的重要角色,Raja也不負眾望的揭曉了眾人關(guān)注的FPGA最新布局。Raja介紹道,新款的異構(gòu)FPGA計算方案將會采用10nm制程,且規(guī)模將覆蓋到從過去的中低端方案到高端方案,以同一架構(gòu)不同規(guī)模的設(shè)計來解決不同層次的計算問題。而且下一代FPGA芯片會引入3D封裝技術(shù)。
重拳出擊!六大技術(shù)新動向
值得一提的是,在封裝領(lǐng)域,英特爾推出的 Foveros 是業(yè)界首個真正的 3D 封裝,可以把整個系統(tǒng)封進一顆芯片中,達成真正的 System in
Package 概念,遠比目前臺積電與三星都在發(fā)展的 2D 或 2.5D 封裝技術(shù)更為先進。
1、業(yè)界首創(chuàng)邏輯芯片3D堆疊
英特爾展示了Foveros全新3D封裝技術(shù),該技術(shù)首次引入了3D堆疊的優(yōu)勢,可實現(xiàn)在邏輯芯片上堆疊邏輯芯片,比目前臺積電與三星在發(fā)展的 2D 或
2.5D 封裝技術(shù)要更先進。英特爾預計將從2019年下半年開始推出一系列使用Foveros的產(chǎn)品。
首款Foveros產(chǎn)品將整合高性能10nm計算堆疊“芯片組合”和低功耗22FFL基礎(chǔ)晶片。
英特爾稱,它將在小巧的產(chǎn)品形態(tài)中實現(xiàn)世界一流的性能與功耗效率。
據(jù)稱此封裝技術(shù)可做到約1mm的超薄厚度,Raja還在現(xiàn)場秀出僅有12mm x 12mm尺寸的量產(chǎn)芯片。
Foveros為整合高性能、高密度和低功耗硅工藝技術(shù)的器件和系統(tǒng)鋪平了道路,有望第一次將晶片的堆疊從傳統(tǒng)的無源中間互連層和堆疊存儲芯片擴展到高性能邏輯芯片,如CPU、圖形和AI處理器。
因為設(shè)計人員可在新的產(chǎn)品形態(tài)中“混搭”不同的技術(shù)專利模塊與各種存儲芯片和I/O配置,該技術(shù)提供了極大的靈活性,并使得產(chǎn)品能分解成更小的“芯片組合”,其中I/O、SRAM和電源傳輸電路可以集成在基礎(chǔ)晶片中,而高性能邏輯“芯片組合”則堆疊在頂部。
英特爾表示, Foveros將成為繼2018年英特爾推出突破性的嵌入式多芯片互連橋接(EMIB)2D封裝技術(shù)之后的下一個技術(shù)飛躍。
2、全新CPU微架構(gòu)Sunny Cove
英特爾推出了接手 Skylake 的新一代CPU微架構(gòu)Sunny
Cove,旨在提高通用計算任務(wù)下每時鐘計算性能和降低功耗,并包含了可加速人工智能和加密等專用計算任務(wù)的新功能。
Sunny Cove將在明年晚些時候成為英特爾下一代服務(wù)器(至強)和客戶端(酷睿)處理器的基礎(chǔ)架構(gòu)。
Sunny Cove的主要功能特性包括:
(1)增強的微架構(gòu),可并行執(zhí)行更多操作。
(2)可降低延遲的新算法。
(3)增加關(guān)鍵緩沖區(qū)和緩存的大小,其一級緩存增大了50%,內(nèi)存定址最大可定達4096TB,可優(yōu)化以數(shù)據(jù)為中心的工作負載。
(4)針對特定用例和算法的架構(gòu)擴展。例如,提升加密性能的新指令,如矢量AES和SHA-NI,以及壓縮/解壓縮等其它關(guān)鍵用例。
Sunny Cove不僅能夠減少延遲、提高吞吐量,而且提供更高的并行計算能力。英特爾表示,它將有望改善從游戲到多媒體到以數(shù)據(jù)為中心的應(yīng)用體驗。
緊隨Sunny Cove之后,Willow Cove和Golden
Cove也將分別對緩存、晶體管進行更多優(yōu)化,甚至會瞄準網(wǎng)絡(luò)設(shè)備和5G應(yīng)用等來進一步強化 AI 等關(guān)鍵應(yīng)用的性能表現(xiàn)。
3、全新第11代集成圖形卡
英特爾推出全新的第11代集成圖形卡,配備64個增強型執(zhí)行單元,比此前的英特爾第9代圖形卡(24個EU)多出一倍,旨在打破每秒1萬億浮點運算次數(shù)(1
TFLOPS)的壁壘。新的集成圖形卡將從2019年開始與10納米處理器一起交付。此外,英特爾還重申了在2020年推出獨立圖形處理器的計劃。
英特爾此前要在去年發(fā)布第10代集成圖形卡,但由于改善幅度過小,最終該方案被舍棄,轉(zhuǎn)而發(fā)展 11 代圖形卡。
與英特爾第9代圖形卡相比,新的集成圖形卡架構(gòu)有望將每時鐘計算性能提高一倍。憑借高于每秒1萬億浮點運算次數(shù)的性能,該架構(gòu)旨在提高游戲的可玩性。
此外,英特爾在此次活動上展示的第11代圖形卡幾乎將一款流行的照片識別應(yīng)用程序的性能提高了一倍。
第11代圖形卡預計還將采用業(yè)界領(lǐng)先的媒體編碼器和解碼器,在有限的功耗配額下支持4K視頻流和8K內(nèi)容創(chuàng)作。第11代圖形卡還將采用英特爾自適應(yīng)同步技術(shù),為游戲提供流暢的幀速率。
4、One API軟件
英特爾還推出了新的One API項目,可以在單一開發(fā)環(huán)境之下,簡化跨CPU、GPU、FPGA、人工智能和其它加速器的各種計算引擎的編程。
該項目包括一個全面、統(tǒng)一的開發(fā)工具組合,以將軟件匹配到能最大程度加速軟件代碼的硬件上。其公開發(fā)行版本預計將于2019年發(fā)布。
5、內(nèi)存和存儲
英特爾還公布了英特爾傲騰技術(shù)以及相關(guān)產(chǎn)品的最新情況。作為一款新產(chǎn)品,英特爾傲騰數(shù)據(jù)中心級持久內(nèi)存集成了內(nèi)存般的性能、數(shù)據(jù)的持久性和存儲的大容量。
這項技術(shù)通過將更多數(shù)據(jù)放到更接近CPU的位置,能夠提高使應(yīng)用在AI和大型數(shù)據(jù)庫中的更大量的數(shù)據(jù)集能夠的處理速度。
其大容量和數(shù)據(jù)的持久性減少了對存儲進行訪問時的時延損失,從而提高工作負載的性能。英特爾傲騰數(shù)據(jù)中心級持久內(nèi)存為CPU提供緩存行(64B)讀取。
一般來說,當應(yīng)用把讀取操作定向到傲騰持久內(nèi)存或請求的數(shù)據(jù)不在DRAM中緩存時,傲騰持久內(nèi)存的平均空閑讀取延遲大約為350納秒。
如果實現(xiàn)規(guī)?;?,傲騰數(shù)據(jù)中心級固態(tài)盤的平均空閑讀取延遲約為10,000納秒(10微秒),這將是顯著的改進2。
在一些情況下,當請求的數(shù)據(jù)在DRAM中時,不管是通過CPU的內(nèi)存控制器進行緩存還是由應(yīng)用所引導,內(nèi)存子系統(tǒng)的響應(yīng)速度預計與DRAM相同(小于100納秒)。
英特爾還展示了基于英特爾1 TB QLC NAND裸片的固態(tài)盤如何把更多海量數(shù)據(jù)從硬盤遷移到固態(tài)硬盤,從而可以更快訪問這些數(shù)據(jù)。
英特爾傲騰固態(tài)盤與QLC
NAND固態(tài)盤相結(jié)合,將降低對最常用數(shù)據(jù)的訪問延遲。總體來說,這些對平臺和內(nèi)存的改進重塑了內(nèi)存和存儲層次結(jié)構(gòu),從而為系統(tǒng)和應(yīng)用提供了完善的選擇組合。
6、推出深度學習參考堆棧(Deep Learning Reference Stack)
英特爾宣布推出深度學習參考堆棧(Deep Learning Reference
Stack),這是一個集成、高性能的開源堆棧,基于英特爾至強可擴展平臺進行了優(yōu)化。
該開源社區(qū)版本旨在確保人工智能開發(fā)者可以輕松訪問英特爾平臺的所有特性和功能。深度學習參考堆棧經(jīng)過高度調(diào)優(yōu),專為云原生環(huán)境而構(gòu)建。該版本可以降低集成多個軟件組件所帶來的復雜性,幫助開發(fā)人員快速進行原型開發(fā),同時讓用戶有足夠的靈活度打造定制化的解決方案。
(1)操作系統(tǒng):Clear Linux 操作系統(tǒng)可根據(jù)個人開發(fā)需求進行定制,針對英特爾平臺以及深度學習等特定用例進行了調(diào)優(yōu);
(2)編排:Kubernetes可基于對英特爾平臺的感知,管理和編排面向多節(jié)點集群的容器化應(yīng)用;
(3)容器:Docker容器和Kata容器利用英特爾虛擬化技術(shù)來幫助保護容器;
(4)函數(shù)庫:英特爾深度神經(jīng)網(wǎng)絡(luò)數(shù)學核心函數(shù)庫(MKL DNN)是英特爾高度優(yōu)化、面向數(shù)學函數(shù)性能的數(shù)學庫;
(5)運行時:Python針對英特爾架構(gòu)進行了高度調(diào)優(yōu)和優(yōu)化,提供應(yīng)用和服務(wù)執(zhí)行運行時支持;
(6)框架:TensorFlow是一個領(lǐng)先的深度學習和機器學習框架;
(7)部署:KubeFlow是一個開源、行業(yè)驅(qū)動型部署工具,在英特爾架構(gòu)上提供快速體驗,易于安裝和使用。
結(jié)語:踏過荊棘的英特爾或?qū)⑷娉鰮?/strong>
英特爾今年可以說是歷經(jīng)風雨,在市場上和AMD、英偉達等競爭對手交鋒激烈,奉為圣經(jīng)的摩爾定律又屢遭質(zhì)疑。Jim
Keller直接懟回去業(yè)界的風言風語、力挺摩爾定律將長存的行為,可以說是相當干脆和直率。
在2018年收尾之際,英特爾這一波大秀肌肉,可見其不但對未來產(chǎn)品架構(gòu)走向有著清晰、全面且頗為自信的布局,而且做好了從多方面解決問題并滿足一切計算需求的準備。
英特爾能否按著他們的既定計劃順利的走下去?10納米PC芯片能否在明年如約而至?這些答案我們并不知道,但英特爾這次在戰(zhàn)略規(guī)劃上的全面布局,針對行業(yè)發(fā)展痛點各個擊破的做法,一方面會成為芯片產(chǎn)業(yè)下一階段發(fā)展很重要的參考,另一方面也讓我們看到作為全球芯片巨頭的英特爾發(fā)起威來,虎軀一抖也足夠讓芯片屆為之一震。
[NextPage]
|