鈦媒體快訊 | 9月25日消息:就在去年的云棲大會(huì)上,阿里巴巴正式宣布成立芯片公司“平頭哥半導(dǎo)體有限公司”,正式跨入造芯行列。一年后的今天,平頭哥團(tuán)隊(duì)驗(yàn)收初步成果的日子到來(lái)了。
今天,達(dá)摩院院長(zhǎng)張建鋒在杭州云棲大會(huì)現(xiàn)場(chǎng)展示了含光800——阿里巴巴第一顆自研的芯片。
含光其名,源自上古三大神劍之一「含光劍」,該劍含而不露,光而不耀。
“在全球芯片領(lǐng)域,阿里巴巴是一個(gè)新人,玄鐵和含光 800 是平頭哥的萬(wàn)里長(zhǎng)征第一步,我們還有很長(zhǎng)的路要走。”張建鋒補(bǔ)充到。
沿著拆分模塊化角度來(lái)分析,含光 800 性能的突破得益于軟硬件的協(xié)同創(chuàng)新。
從硬件層面來(lái)看,含光 800 采用創(chuàng)新低自研芯片架構(gòu),針對(duì)深度學(xué)習(xí)中使用的大量權(quán)重參數(shù)和張量數(shù)據(jù),在支持稀疏壓縮與量化處理的基礎(chǔ)上,通過(guò)獨(dú)特設(shè)計(jì)的數(shù)據(jù)訪存與流水線處理技術(shù),大大減低了 I/O 需求和數(shù)據(jù)的搬移,NPU 同時(shí)深度優(yōu)化了卷積、矩陣乘、向量計(jì)算和各種激活函數(shù),通過(guò)高有效的硬件資源調(diào)度和全并行的數(shù)據(jù)流處理,有效解決芯片性能瓶頸問(wèn)題;
而在軟件層面,含光 800 集成了達(dá)摩院先進(jìn)算法,針對(duì) CNN 及視覺(jué)類算法深度優(yōu)化計(jì)算、存儲(chǔ)密度,可實(shí)現(xiàn)大網(wǎng)絡(luò)模型在一顆 NPU 上完成計(jì)算。此外,它還擁有自動(dòng)化開(kāi)發(fā)工具,支持 TensorFlow、Caffe 等主流開(kāi)源框架,還可進(jìn)行多模型動(dòng)態(tài)部署。
針對(duì)“云上場(chǎng)景”特殊定制
定位為是一款云端AI芯片,和過(guò)去定位在手機(jī)內(nèi)置SOC里的NPU不同的是,含光800的應(yīng)用場(chǎng)景主要集中于成規(guī)模的計(jì)算中心。
有場(chǎng)景,必然有重心的變化。這一次,含光800更加聚焦于降低運(yùn)維成本所要考慮的能效和為了擴(kuò)大硬件應(yīng)用場(chǎng)景邊界所要考慮的算力峰值。
據(jù)張建鋒介紹,過(guò)去一年,平頭哥團(tuán)隊(duì)始終在不斷探索芯片與場(chǎng)景的融合道路上。以對(duì)算力需求較大的圖像視頻分析、搜索以及推薦等業(yè)務(wù)場(chǎng)景為例,圍繞這一目標(biāo),平頭哥針對(duì)場(chǎng)景深度定制了芯片的軟硬件。“舉個(gè)簡(jiǎn)單的例子,阿里先后自研了架構(gòu)、軟件編譯器、框架、工具鏈等,玄鐵 910、無(wú)劍 SoC 平臺(tái)便是最好的印證。”
相較于其它,本次發(fā)布的絕對(duì)主角含光800,其從芯片設(shè)計(jì)、流片整過(guò)程都顯得極為迅速。據(jù)了解,平頭哥團(tuán)隊(duì) 7 個(gè)月就完成了含光800的前端設(shè)計(jì),之后僅用了3個(gè)月就成功流片。
值得一提的是,眼下,含光800已經(jīng)進(jìn)入商用階段。據(jù)悉,含光800已應(yīng)用在阿里巴巴內(nèi)部核心業(yè)務(wù)中。