北京時(shí)間12月12日對(duì)英特爾來說大事連連,在北京,正舉辦20歲生日的英特爾中國(guó)研究院的隔壁樓房著了大火,而遠(yuǎn)在大洋彼岸,英特爾在加州Los
Altos舉辦的“架構(gòu)日”上連發(fā)大招!
英特爾高管、架構(gòu)師和院士們展示了下一代技術(shù),并介紹了英特爾在驅(qū)動(dòng)不斷擴(kuò)展的數(shù)據(jù)密集型工作負(fù)載方面的戰(zhàn)略進(jìn)展,從而為PC和其他智能消費(fèi)設(shè)備、高速網(wǎng)絡(luò)、人工智能(AI)、云數(shù)據(jù)中心和自動(dòng)駕駛汽車提供支持。
英特爾不僅展示了一系列處于研發(fā)中的基于10納米的系統(tǒng),將用于PC、數(shù)據(jù)中心和網(wǎng)絡(luò)設(shè)備,并預(yù)覽了其他針對(duì)更廣泛工作負(fù)載的技術(shù),還一連分享了聚焦于六個(gè)工程領(lǐng)域的技術(shù)戰(zhàn)略,包括:
1、先進(jìn)的制造工藝和封裝。
2、可加速人工智能(AI)和圖形等專門任務(wù)的新架構(gòu)。
3、超高速內(nèi)存。
4、超微互連。
5、嵌入式安全功能。
6、為開發(fā)者統(tǒng)一和簡(jiǎn)化基于英特爾計(jì)算路線圖進(jìn)行編程的通用軟件。
英特爾表示,對(duì)這些領(lǐng)域的重大投資和技術(shù)創(chuàng)新,將為更加多元化的計(jì)算時(shí)代奠定了基石,到2022年,潛在市場(chǎng)規(guī)模將超過3000億美元。
英特爾高級(jí)副總裁:摩爾定律將長(zhǎng)存!
本次架構(gòu)日的舉辦地加州Los Altos是仙童半導(dǎo)體與英特爾的聯(lián)合創(chuàng)始人Robert
Noyce的故居,該活動(dòng)由英特爾公司處理器核心與視覺計(jì)算高級(jí)副總裁Raja Koduri與英特爾公司高級(jí)副總裁兼硅工程事業(yè)部總經(jīng)理Jim
Keller擔(dān)任主講。
Jim
Keller一出場(chǎng)就懟了所謂摩爾定律大限將至的說法,他表示,在他看完整個(gè)英特爾的技術(shù)布局之后,深覺得他能夠發(fā)揮的空間極大,他會(huì)讓摩爾定律在未來很長(zhǎng)的一段時(shí)間內(nèi)持續(xù)下去,要大跌那些評(píng)論家的眼鏡。
英特爾公司高級(jí)副總裁兼硅工程事業(yè)部總經(jīng)理JimKeller
Raja則認(rèn)為如今數(shù)據(jù)產(chǎn)生速度已遠(yuǎn)遠(yuǎn)超過出現(xiàn)有基礎(chǔ)設(shè)施所能處理的速度,因此未來亟需更高效、規(guī)模更大且更具可擴(kuò)展性的計(jì)算架構(gòu)。根據(jù)現(xiàn)場(chǎng)媒體的報(bào)道,Raja預(yù)言說,未來10年計(jì)算架構(gòu)的發(fā)展將遠(yuǎn)超過過去50年的速度。
Raja提到,由于計(jì)算產(chǎn)業(yè)的轉(zhuǎn)變,未來英特爾在架構(gòu)設(shè)計(jì)上也會(huì)越來越靈活,不但核心本身的設(shè)計(jì)會(huì)更接地氣,同時(shí)也將更強(qiáng)調(diào)不同場(chǎng)景的計(jì)算適配,未來將引入CPU、GPU以外更多的計(jì)算概念,構(gòu)成xPU生態(tài)。
基于不同時(shí)代所需要的計(jì)算架構(gòu)不同,Raja將整個(gè)計(jì)算軌跡分為三個(gè)階段,分別是2000年左右的GHz時(shí)鐘速度階段、2005年開始的多核階段,以及未來的架構(gòu)階段,未來架構(gòu)將是主導(dǎo)整個(gè)計(jì)算市場(chǎng)的最主要核心。Raja表示,英特爾將針對(duì)三大計(jì)算領(lǐng)域布局更廣的計(jì)算架構(gòu),包括CPU和GPU在內(nèi)的這些架構(gòu)都將混合更多元、更具彈性的計(jì)算能力。
英特爾公司處理器核心與視覺計(jì)算高級(jí)副總裁Raja Koduri
針對(duì)AI應(yīng)用這一當(dāng)下和未來的主流計(jì)算趨勢(shì),英特爾也會(huì)在其主力架構(gòu)中增加更多包含深度學(xué)習(xí)、訓(xùn)練以及推理計(jì)算加速的功能區(qū)塊。
其下一代 14nm 處理器Cooper Lake將引進(jìn) AI 模型訓(xùn)練加速能力,支持 bfloat16的數(shù)據(jù)格式,可達(dá)到比
fp32高兩倍的數(shù)據(jù)輸出能力。
Raja還大秀英特爾在CPU以及GPU方面的最新布局,并展示未來英特爾CPU的核心發(fā)展路線,剖析了整個(gè)計(jì)算市場(chǎng)的走向。他也介紹了其最新的 Gen 11
世代繪圖核心,并表示會(huì)將規(guī)模持續(xù)做大,設(shè)計(jì)出更符合全方位計(jì)算與繪圖應(yīng)用的獨(dú)立GPU架構(gòu),正面迎擊AMD與英偉達(dá)。
此外,存儲(chǔ)、封裝以及服務(wù)器的技術(shù)布局均在Raja本次全面介紹的射程之中。
作為xPU系列中的重要角色,Raja也不負(fù)眾望的揭曉了眾人關(guān)注的FPGA最新布局。Raja介紹道,新款的異構(gòu)FPGA計(jì)算方案將會(huì)采用10nm制程,且規(guī)模將覆蓋到從過去的中低端方案到高端方案,以同一架構(gòu)不同規(guī)模的設(shè)計(jì)來解決不同層次的計(jì)算問題。而且下一代FPGA芯片會(huì)引入3D封裝技術(shù)。
重拳出擊!六大技術(shù)新動(dòng)向
值得一提的是,在封裝領(lǐng)域,英特爾推出的 Foveros 是業(yè)界首個(gè)真正的 3D 封裝,可以把整個(gè)系統(tǒng)封進(jìn)一顆芯片中,達(dá)成真正的 System in
Package 概念,遠(yuǎn)比目前臺(tái)積電與三星都在發(fā)展的 2D 或 2.5D 封裝技術(shù)更為先進(jìn)。
1、業(yè)界首創(chuàng)邏輯芯片3D堆疊
英特爾展示了Foveros全新3D封裝技術(shù),該技術(shù)首次引入了3D堆疊的優(yōu)勢(shì),可實(shí)現(xiàn)在邏輯芯片上堆疊邏輯芯片,比目前臺(tái)積電與三星在發(fā)展的 2D 或
2.5D 封裝技術(shù)要更先進(jìn)。英特爾預(yù)計(jì)將從2019年下半年開始推出一系列使用Foveros的產(chǎn)品。
首款Foveros產(chǎn)品將整合高性能10nm計(jì)算堆疊“芯片組合”和低功耗22FFL基礎(chǔ)晶片。
英特爾稱,它將在小巧的產(chǎn)品形態(tài)中實(shí)現(xiàn)世界一流的性能與功耗效率。
據(jù)稱此封裝技術(shù)可做到約1mm的超薄厚度,Raja還在現(xiàn)場(chǎng)秀出僅有12mm x 12mm尺寸的量產(chǎn)芯片。
Foveros為整合高性能、高密度和低功耗硅工藝技術(shù)的器件和系統(tǒng)鋪平了道路,有望第一次將晶片的堆疊從傳統(tǒng)的無源中間互連層和堆疊存儲(chǔ)芯片擴(kuò)展到高性能邏輯芯片,如CPU、圖形和AI處理器。
因?yàn)樵O(shè)計(jì)人員可在新的產(chǎn)品形態(tài)中“混搭”不同的技術(shù)專利模塊與各種存儲(chǔ)芯片和I/O配置,該技術(shù)提供了極大的靈活性,并使得產(chǎn)品能分解成更小的“芯片組合”,其中I/O、SRAM和電源傳輸電路可以集成在基礎(chǔ)晶片中,而高性能邏輯“芯片組合”則堆疊在頂部。
英特爾表示, Foveros將成為繼2018年英特爾推出突破性的嵌入式多芯片互連橋接(EMIB)2D封裝技術(shù)之后的下一個(gè)技術(shù)飛躍。
2、全新CPU微架構(gòu)Sunny Cove
英特爾推出了接手 Skylake 的新一代CPU微架構(gòu)Sunny
Cove,旨在提高通用計(jì)算任務(wù)下每時(shí)鐘計(jì)算性能和降低功耗,并包含了可加速人工智能和加密等專用計(jì)算任務(wù)的新功能。
Sunny Cove將在明年晚些時(shí)候成為英特爾下一代服務(wù)器(至強(qiáng))和客戶端(酷睿)處理器的基礎(chǔ)架構(gòu)。
Sunny Cove的主要功能特性包括:
(1)增強(qiáng)的微架構(gòu),可并行執(zhí)行更多操作。
(2)可降低延遲的新算法。
(3)增加關(guān)鍵緩沖區(qū)和緩存的大小,其一級(jí)緩存增大了50%,內(nèi)存定址最大可定達(dá)4096TB,可優(yōu)化以數(shù)據(jù)為中心的工作負(fù)載。
(4)針對(duì)特定用例和算法的架構(gòu)擴(kuò)展。例如,提升加密性能的新指令,如矢量AES和SHA-NI,以及壓縮/解壓縮等其它關(guān)鍵用例。
Sunny Cove不僅能夠減少延遲、提高吞吐量,而且提供更高的并行計(jì)算能力。英特爾表示,它將有望改善從游戲到多媒體到以數(shù)據(jù)為中心的應(yīng)用體驗(yàn)。
緊隨Sunny Cove之后,Willow Cove和Golden
Cove也將分別對(duì)緩存、晶體管進(jìn)行更多優(yōu)化,甚至?xí)闇?zhǔn)網(wǎng)絡(luò)設(shè)備和5G應(yīng)用等來進(jìn)一步強(qiáng)化 AI 等關(guān)鍵應(yīng)用的性能表現(xiàn)。
3、全新第11代集成圖形卡
英特爾推出全新的第11代集成圖形卡,配備64個(gè)增強(qiáng)型執(zhí)行單元,比此前的英特爾第9代圖形卡(24個(gè)EU)多出一倍,旨在打破每秒1萬億浮點(diǎn)運(yùn)算次數(shù)(1
TFLOPS)的壁壘。新的集成圖形卡將從2019年開始與10納米處理器一起交付。此外,英特爾還重申了在2020年推出獨(dú)立圖形處理器的計(jì)劃。
英特爾此前要在去年發(fā)布第10代集成圖形卡,但由于改善幅度過小,最終該方案被舍棄,轉(zhuǎn)而發(fā)展 11 代圖形卡。
與英特爾第9代圖形卡相比,新的集成圖形卡架構(gòu)有望將每時(shí)鐘計(jì)算性能提高一倍。憑借高于每秒1萬億浮點(diǎn)運(yùn)算次數(shù)的性能,該架構(gòu)旨在提高游戲的可玩性。
此外,英特爾在此次活動(dòng)上展示的第11代圖形卡幾乎將一款流行的照片識(shí)別應(yīng)用程序的性能提高了一倍。
第11代圖形卡預(yù)計(jì)還將采用業(yè)界領(lǐng)先的媒體編碼器和解碼器,在有限的功耗配額下支持4K視頻流和8K內(nèi)容創(chuàng)作。第11代圖形卡還將采用英特爾自適應(yīng)同步技術(shù),為游戲提供流暢的幀速率。
4、One API軟件
英特爾還推出了新的One API項(xiàng)目,可以在單一開發(fā)環(huán)境之下,簡(jiǎn)化跨CPU、GPU、FPGA、人工智能和其它加速器的各種計(jì)算引擎的編程。
該項(xiàng)目包括一個(gè)全面、統(tǒng)一的開發(fā)工具組合,以將軟件匹配到能最大程度加速軟件代碼的硬件上。其公開發(fā)行版本預(yù)計(jì)將于2019年發(fā)布。
5、內(nèi)存和存儲(chǔ)
英特爾還公布了英特爾傲騰技術(shù)以及相關(guān)產(chǎn)品的最新情況。作為一款新產(chǎn)品,英特爾傲騰數(shù)據(jù)中心級(jí)持久內(nèi)存集成了內(nèi)存般的性能、數(shù)據(jù)的持久性和存儲(chǔ)的大容量。
這項(xiàng)技術(shù)通過將更多數(shù)據(jù)放到更接近CPU的位置,能夠提高使應(yīng)用在AI和大型數(shù)據(jù)庫(kù)中的更大量的數(shù)據(jù)集能夠的處理速度。
其大容量和數(shù)據(jù)的持久性減少了對(duì)存儲(chǔ)進(jìn)行訪問時(shí)的時(shí)延損失,從而提高工作負(fù)載的性能。英特爾傲騰數(shù)據(jù)中心級(jí)持久內(nèi)存為CPU提供緩存行(64B)讀取。
一般來說,當(dāng)應(yīng)用把讀取操作定向到傲騰持久內(nèi)存或請(qǐng)求的數(shù)據(jù)不在DRAM中緩存時(shí),傲騰持久內(nèi)存的平均空閑讀取延遲大約為350納秒。
如果實(shí)現(xiàn)規(guī)?;硫v數(shù)據(jù)中心級(jí)固態(tài)盤的平均空閑讀取延遲約為10,000納秒(10微秒),這將是顯著的改進(jìn)2。
在一些情況下,當(dāng)請(qǐng)求的數(shù)據(jù)在DRAM中時(shí),不管是通過CPU的內(nèi)存控制器進(jìn)行緩存還是由應(yīng)用所引導(dǎo),內(nèi)存子系統(tǒng)的響應(yīng)速度預(yù)計(jì)與DRAM相同(小于100納秒)。
英特爾還展示了基于英特爾1 TB QLC NAND裸片的固態(tài)盤如何把更多海量數(shù)據(jù)從硬盤遷移到固態(tài)硬盤,從而可以更快訪問這些數(shù)據(jù)。
英特爾傲騰固態(tài)盤與QLC
NAND固態(tài)盤相結(jié)合,將降低對(duì)最常用數(shù)據(jù)的訪問延遲。總體來說,這些對(duì)平臺(tái)和內(nèi)存的改進(jìn)重塑了內(nèi)存和存儲(chǔ)層次結(jié)構(gòu),從而為系統(tǒng)和應(yīng)用提供了完善的選擇組合。
6、推出深度學(xué)習(xí)參考堆棧(Deep Learning Reference Stack)
英特爾宣布推出深度學(xué)習(xí)參考堆棧(Deep Learning Reference
Stack),這是一個(gè)集成、高性能的開源堆棧,基于英特爾至強(qiáng)可擴(kuò)展平臺(tái)進(jìn)行了優(yōu)化。
該開源社區(qū)版本旨在確保人工智能開發(fā)者可以輕松訪問英特爾平臺(tái)的所有特性和功能。深度學(xué)習(xí)參考堆棧經(jīng)過高度調(diào)優(yōu),專為云原生環(huán)境而構(gòu)建。該版本可以降低集成多個(gè)軟件組件所帶來的復(fù)雜性,幫助開發(fā)人員快速進(jìn)行原型開發(fā),同時(shí)讓用戶有足夠的靈活度打造定制化的解決方案。
(1)操作系統(tǒng):Clear Linux 操作系統(tǒng)可根據(jù)個(gè)人開發(fā)需求進(jìn)行定制,針對(duì)英特爾平臺(tái)以及深度學(xué)習(xí)等特定用例進(jìn)行了調(diào)優(yōu);
(2)編排:Kubernetes可基于對(duì)英特爾平臺(tái)的感知,管理和編排面向多節(jié)點(diǎn)集群的容器化應(yīng)用;
(3)容器:Docker容器和Kata容器利用英特爾虛擬化技術(shù)來幫助保護(hù)容器;
(4)函數(shù)庫(kù):英特爾深度神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)核心函數(shù)庫(kù)(MKL DNN)是英特爾高度優(yōu)化、面向數(shù)學(xué)函數(shù)性能的數(shù)學(xué)庫(kù);
(5)運(yùn)行時(shí):Python針對(duì)英特爾架構(gòu)進(jìn)行了高度調(diào)優(yōu)和優(yōu)化,提供應(yīng)用和服務(wù)執(zhí)行運(yùn)行時(shí)支持;
(6)框架:TensorFlow是一個(gè)領(lǐng)先的深度學(xué)習(xí)和機(jī)器學(xué)習(xí)框架;
(7)部署:KubeFlow是一個(gè)開源、行業(yè)驅(qū)動(dòng)型部署工具,在英特爾架構(gòu)上提供快速體驗(yàn),易于安裝和使用。
結(jié)語:踏過荊棘的英特爾或?qū)⑷娉鰮?/strong>
英特爾今年可以說是歷經(jīng)風(fēng)雨,在市場(chǎng)上和AMD、英偉達(dá)等競(jìng)爭(zhēng)對(duì)手交鋒激烈,奉為圣經(jīng)的摩爾定律又屢遭質(zhì)疑。Jim
Keller直接懟回去業(yè)界的風(fēng)言風(fēng)語、力挺摩爾定律將長(zhǎng)存的行為,可以說是相當(dāng)干脆和直率。
在2018年收尾之際,英特爾這一波大秀肌肉,可見其不但對(duì)未來產(chǎn)品架構(gòu)走向有著清晰、全面且頗為自信的布局,而且做好了從多方面解決問題并滿足一切計(jì)算需求的準(zhǔn)備。
英特爾能否按著他們的既定計(jì)劃順利的走下去?10納米PC芯片能否在明年如約而至?這些答案我們并不知道,但英特爾這次在戰(zhàn)略規(guī)劃上的全面布局,針對(duì)行業(yè)發(fā)展痛點(diǎn)各個(gè)擊破的做法,一方面會(huì)成為芯片產(chǎn)業(yè)下一階段發(fā)展很重要的參考,另一方面也讓我們看到作為全球芯片巨頭的英特爾發(fā)起威來,虎軀一抖也足夠讓芯片屆為之一震。
[NextPage]
|