FPGA进入嵌入式领域处理器内核成关键
全球FPGA整体市场最近几年迅速扩大,其中与嵌入式FPGA处理器相关的Design Win数量正在迅速增长,潜力巨大。就像打开潘多拉的盒子,有了可以运行操作系统或实时操作系统的处理器内核,相信FPGA正在真正意义上大规模进入嵌入式设计领域。
从Xilinx、Altera到Actel、Lattice,FPGA提供商都已经有可在FPGA逻辑模块旁实现的“硬”核,或者可以直接在FPGA结构中运行的“软” 核处理器。硬核的好处是能够提供更快的数据处理能力,所谓软核需要FPGA厂商提供的PLD软件进行配置,然后固化到FPGA中。与硬核相比,软核具有更好的灵活性,在目标器件中可以进行任意配置,根据具体设计需要灵活选择IP模块和外设。
Xilinx除了32位的嵌入式PowerPC硬核之外,还支持8位的PicoBlaze和32位的MicroBlaze两个软内核。Xilinx亚太区高端产品市场经理梁晓明先生表示, 高端和低端FPGA嵌入式市场都在迅速成长,所以Xilinx会持续兼顾发展这三种嵌入式处理器。Altera只提供软核,其32位Nios II软核处理器与Xilinx的MicroBlaze旗鼓相当,同样都是目前市场上最通用的嵌入式FPGA处理器。
最近Nios II和MicroBlaze都增加了对新的IEEE754兼容浮点单元的支持。Altera公司亚太区产品和渠道营销工程师王冬刚先生解释说,IEEE754标准定义了在计算机中表示浮点的一套格式。这一特性的优点在于能够更精确地表达数字,只要是需要高精度计算的场合都可以考虑用浮点处理单元改善计算精度。就像浮点表示在Intel的Pentium系列CPU中成为标准一样,越来越多的嵌入式应用需要这一特性,比如进程控制,图像处理,汽车中电机转速的精确表示等等。
另一家FPGA供应商Actel期望在不同市场层面上与Altera和Xilinx展开竞争。Actel在其FPGA中嵌入了32位的ARM7微处理器内核CoreMP7。传统的嵌入式处理器,例如ARM和MIPS,其处理器IP在基于软核的设计流程中很难得到保护,所以ARM或MIPS内核一直无法以软IP的形式提供给FPGA厂商,但是不同于主流的基于SRAM的FPGA, Actel基于Flash技术的FPGA可以保证商用IP在器件中安全的运行。
Actel 公司IP 市场经理Mike Thompson表示,较之于所有同类处理器使用的总和,ARM处理器在设计中获采纳的比例为5比1。CoreMP7与ARM7TDMI-S完全兼容,大多数客户以往用过ARM处理器核。进一步说都拥有现成的ARM代码,以及所熟悉的开发工具。对ARM架构的熟悉,可以节省Actel客户的开发时间。
与Actel选择不同结构的产品进而转战市场不同,Lattice希望可以与Altera和Xilinx展开直接竞争,在不断扩充产品的同时寻求差异化。在嵌入式处理器方面,Lattice也在延续这种竞争的策略,与MicroBlaze和Nios II一样,Lattice的LatticeMico32软核处理器也很容易嵌入到FPGA中,Lattice IP及应用设计经理谢征帆先生强调,与前两者有所不同的是,Lattice开放了LatticeMico32以及外围元件的HDL源代码,用户能更好地理解微处理器核的结构和工作的内部细节,同时可以自行修改代码,增加设计的移植性。软件的开发工具,包括基于GNU的编译器、汇编器、连接器和调试器也都是开放源码的。甚至LatticeMico32软核处理器可以用在Lattice公司以外的产品中,包括ASIC、结构化ASIC以及其他厂商的FPGA中。
绝大多数的嵌入式系统只需一个内核,比如消费类产品、网络通讯以及工业系统。多处理器常用于高端数据处理的情况,比如对于一些视频处理比较复杂的算法或者有大量复杂协议处理的应用,可能需要两个以上的嵌入式处理器。在一个FPGA中可以实现多个处理器,比如说两个MicroBlaze或Nios II,或者更多数目。这之中没有定式,完全取决于客户期望的目标来灵活实现不同的应用模式,例如一个MicroBlaze作为主,另一个做特殊任务处理器;或者两个MicroBlaze相互独立的执行各自的任务。正因为如此,这个优势是一般已经固化了外设和定制功能的ASSP和ASIC无法比拟的。为此,针对多核应用的调试工具也已经应运而生,Altera和Xilinx都获得了德国知名的微处理器开发工具的供应商Lauterbach的支持,Lauterbach的TRACE32 ICD-Debugger 和TRACE32 PowerTools调试工具支持多核的PowerPC、MicroBlaze以及Nios II系统的开发。
软核处理器的主要限制在于处理器的性能,但是在FPGA中嵌入式处理器的性能并不是很大的问题,原因在于关键的功能,比如各种复杂的DSP算法,可以通过硬件加速来实现,如今许多FPGA中都有大量的硬连线乘法器或乘累加单元,可用来定制硬件加速器。对于需要提高嵌入式软件性能的软件工程师而言,硬件加速器是非常重要的工具,与运行在软核中的代码相比,FPGA加速的代码的运行速度可以快几个数量级,消耗的功率则大大降低。
挑战在于硬件加速器的设计属于FPGA硬件设计范畴,需要开发人员熟练的掌握HDL,逻辑综合以及复杂的时序设计,同时要花费大量的时间,因此硬件加速器的设计就成为了瓶颈。
Altera最近开发了C