快捷搜索:

FPGA有什么优势,什么样的场景更适合FPGA

(文章滥觞:安防常识网)

今朝,在AI谋略平台应用最广泛的两种加速部件是GPUFPGA。GPU可适用于具备谋略密集、高并行、SIMD(SingleInstructionMulTIpleData,单指令多半据流)利用等特征的深度进修练习模型领域,并且GPU创建了包孕CNN、DNN、RNN、LSTM以及强化进修收集等算法在内的利用加速平台和生态系统。

然则,近来FPGA又几回再三被各AI领域的巨子看好,比如微软、百度、科大年夜讯飞都对FPGA利用前景有所等候。那么假如让你选择FPGA作为AI谋略系统的主力军,你会有什么样的挂念?

首先,深度进修包孕两个谋略环节,即练习和推理环节。GPU在深度进修算法模型练习上异常高效,但在推理时对付小批量数据,并行谋略的上风不能发挥出来。而FPGA同时拥有流水线并行和数据并行,是以处置惩罚义务时刻延迟更低。

例如处置惩罚一个数据包有10个步骤,FPGA可以搭建一个10级流水线,流水线的不合级在处置惩罚不合的数据包,每个数据包流经10级之后处置惩罚完成。每处置惩罚完成一个数据包,就能顿时输出。平日来说,FPGA加速只必要微秒级的PCIe延迟。当Intel推出经由过程QPI快速通道互联的Xeon+FPGA之后,CPU和FPGA之间的延迟以致可以降到100纳秒以下。

其次,FPGA是可编程芯片,算法烧录加倍机动。今朝来看,深度进修算法还未完全成熟,算法还在迭代衍化历程中,若深度进修算法发生大年夜的变更,FPGA是软件定义硬件,可以机动切换算法,快速切入市场。

未来至少95%的机械进修谋略都是用于揣摸,只有不到5%是用于模型练习,而FPGA恰是强在揣摸。大年夜幅提升揣摸效率的同时,还能最小限度丧掉正确性,这恰是FPGA的强项。与CPU和GPU不合,FPGA是一种范例的非诺依曼架构,是硬件适配软件的模式,它能够根据系统资本和算法特性机动的调剂并行度,达到最优的适配,是以能效比高于CPU和GPU。

以浪潮F10A为例,这是今朝业界支持OpenCL的最高密度最高机能的FPGA加速设备,基于Altera的Arria10芯片,单芯片峰值运算能力达到了1.5TFlops,功耗却只需35W,每瓦特点能达到42GFlops。同时,F10A设计为高密度的半高半长PCI-E插卡,同时具有机动的板卡内存设置设置设备摆设摆设,最大年夜支持32G双通道内存,是业内一致FPGA卡内存容量的4-8倍。此外,F10A支持2个10Gb光口,可以实现数据直接从收集到板卡处置惩罚,无需颠末CPU,大年夜大年夜减低了传输延时。

测试数据显示,在语音识别利用下,浪潮F10A较CPU机能加速2.87倍,而功耗相称于CPU的15.7%,机能功耗比提升18倍。

您可能还会对下面的文章感兴趣: