【導讀】3月6日,在“AI in 5G——引領新時代論壇”上,人工智能產業(yè)發(fā)展聯(lián)盟(AIIA)正式發(fā)布“AIIA DNN benchmark V0.5”首輪評估結果。
3月6日,在“AI in 5G——引領新時代論壇”上,人工智能產業(yè)發(fā)展聯(lián)盟(AIIA)正式發(fā)布“AIIA DNN benchmark V0.5”首輪評估結果。該評估在AIIA權威測試平臺完成,基于端側推斷任務的深度神經網絡處理器基準測試。在四大典型應用場景下,能夠客觀反映具有深度學習處理能力的處理器或加速器的性能水平。評估結果顯示,海思麒麟980和瑞芯微RK3399表現(xiàn)上佳。
“AIIA DNN benchmark V0.5”評估的標準較為嚴苛,包含四大典型場景和兩大類評測指標等,指標包含速度(fps)和算法性能,如top1 、top5、mAP、mIoU、PSNR等。同時,這也是深度學習處理器領域首次區(qū)分整型和浮點對比的Benchmark。福州瑞芯微電子的RK3399開發(fā)板展現(xiàn)出搶眼數(shù)據(jù)。
采用28nm工藝的福州瑞芯微電子RK3399開發(fā)板,在評估中展現(xiàn)出超強性能。評估數(shù)據(jù)顯示,在浮點模型不需要定點化重新訓練的情況下,int8計算以精度損失最大為1%的代價,達到相對于浮點計算兩倍的性能。
此外,在Interpretation評測中,AIIA第一次嘗試在基準測試中將量化和浮點模型分開評測。而福州瑞芯微電子RK3399開發(fā)板同樣取得多項優(yōu)異數(shù)據(jù),在業(yè)內處于前列水平。
值得一提的是,福州瑞芯微電子RK3399開發(fā)板數(shù)據(jù)搶眼的背后,離不開前沿技術的支持。比如RK3399融入了Tengine,后者是由OPEN AI LAB開發(fā)的一款輕量級模塊化高性能神經網絡推理引擎。Tengine專門針對Arm嵌入式設備優(yōu)化,且無需依賴第三方庫,可跨平臺使用支持Android、Liunx等。
Tengine支持各類常見卷積神經網絡,包括SqueezeNet,MobileNet,AlexNet,ResNet等,支持層融合、8位量化等優(yōu)化策略。通過調用針對不同CPU微構架優(yōu)化的HCL庫,能將Arm CPU的性能充分挖掘出來。而RK3399的Cortex-A72單線程運行移動端常用的MobileNet,一次只需要111ms。
在IoT設備、智能交互設備、個人電腦、機器人等人工智能設備的創(chuàng)新與研發(fā)上,福州瑞芯微電子已經在技術上展現(xiàn)出領先優(yōu)勢,除了RK3399以外,旗艦級人工智能芯片RK3399Pro同樣極具看點,其首次采用CPU+GPU+NPU的硬件結構設計。這一芯片集成的NPU(神經網絡處理器)融合了福州瑞芯微電子在機器視覺、語音處理、深度學習等方面的關鍵技術,片上NPU運算性能高達3.0TOPs,具備高性能、低功耗、開發(fā)易等優(yōu)勢。
人工智能芯片大變革時代,人工智能產業(yè)發(fā)展聯(lián)盟(AIIA) “AIIA DNN benchmark V0.5”權威測試平臺的亮相以及首輪數(shù)據(jù)發(fā)布,或將終結AI芯片缺乏統(tǒng)一數(shù)據(jù)測試標準的局面,加速人工智能芯片的技術蛻變與進化。