快捷搜索:  as

嵌入式视觉处理器让神经网络性能翻倍

DesignWareEV6xVisionProcessor集成了多达4个512位向量DSP和1个CNN引擎,为各类当前和新兴的嵌入式视觉利用供给可扩展机能。

含专用可编程CNN引擎的EV6x处置惩罚器支持所有CNN图形:MetaWareEVDevelopmentToolkit是一套支持OpenCLC、OpenVX和OpenCV的对象,可简化利用软件的开拓:MetaWareEVDevelopmentToolkit中的新CNN映射对象可将处置惩罚义务自动分派给可用的硬件资本,以便加快履行速率

新思科技(Synopsys,Inc.,纳斯达克股票代码:SNPS)日前发布:已经增强了DesignWare®EV6xVisionProcessor中的卷积神经收集(CNN)引擎,以应对高机能嵌入式视觉利用越来越高的视频分辨率和帧率要求。在实施16nmFinFET制程技巧时,平日前提下,CNN引擎可供给高达每秒4.5TeraMAC的谋略能力,其机能是曩昔的SynopsysCNN引擎的4倍。

它还支持系数和特性映射压缩/解压缩,以低落数据带宽要求,低落功耗。视觉CPU从一个向量DSP扩展到四个向量DSP,可与CNN引擎并交运行,从而为*驾驶帮助系统(ADAS)、视频监控、增强现实和虚拟现实、同步定位与建图(SLAM)等一系列高机能嵌入式利用供给*的吞吐量。

MorphoUS,Inc.副总裁ToshiTorihara表示:“在神经收集中,嵌入式视觉利用核心的技巧需求必要供给将高精度和高机能与低功耗和小面积相结合的办理规划。DesignWareEV6xVisionProcessor独特地结合了向量DSP和可编程CNN引擎,支持设计职员在其嵌入式设备中实施视觉功能,该嵌入式设备的机能效率高于基于CPU和GPU的替代规划。”

DesignWareEV6x处置惩罚器系列集成了标量、向量DSP和CNN处置惩罚单元,可进行高度准确、快速的视觉处置惩罚。EV6x支持所有卷积神经收集,包括AlexNet、VGG16、GoogLeNet、Yolo、FasterR-CNN、SqueezeNet和ResNet等受迎接的神经收集。

设计职员可以在EV6x的12位CNN引擎上运行蓝本为32位浮点硬件筹备的CNN练习图形,从而在保持相同的检测精度时显明低落其设计的功耗和面积。在应用16-nmFinFET制程技巧实施时(*糟的环境下),引擎供给高达每秒每瓦2,000GMAC的能效。EV6x的CNN硬件还支持为8位精度练习的神经收集,以使用内存带宽较低、图形类型功耗要求较低的上风。

为了简化利用软件开拓,有一套周全的对象和软件支持EV6x处置惩罚器。*新版本DesignWareARC®MetaWareEVDevelopmentToolkit包括CNN映射对象,它能阐发应用Caffe和Tensorflow等受迎接的框架练习的神经收集,并自动天生用于可编程CNN引擎的可履行文件。为了尽可能机动和防止逾期,该对象还能在视觉CPU和CNN资本间分配谋略,以支持新兴的全新神经收集算法以及客户特定的CNN层。结合基于OpenVX™、OpenCV和OpenCLC嵌入式视觉标准的软件开拓对象,MetaWareEVDevelopmentToolkit容许设计职员拥有加速嵌入式软件开拓所需的全套对象。

SynopsysIP营销副总裁JohnKoeter表示:“跟着高机能神经收集在人工智能利用中变得加倍遍及,设计职员必要硬件技巧和软件技巧才能按时供给支持视觉的SoC。凭借颠末硅验证的EV6xVisionProcessor的机能和功能增强,设计职员可以更有效地设计和支配基于机械进修的利用,使这些利器具有在市场中脱颖而出所需的机能和能效。”

您可能还会对下面的文章感兴趣: