华为麒麟980创6项全球第一，开启手机终端AI应用竞速赛

作者：于平 2018-09-07618

近日，在2018德国IFA展会上，华为消费者BG CEO余承东以“奇点将至”之名，正式发布了麒麟980。作为全球首款量产的7nm手机芯片、双NPU加持，麒麟980共拿下全球六项第一，相比上一代旗舰——10nm工艺制程的麒麟970，980性能提升约20%，能效提升约40%，逻辑电路密度提升60%，即原来的1.6倍。

众所周知，传统芯片遵循摩尔定律，以提升单位面积内晶体管的数量，来提升芯片的性能。工艺提升，于企业而言，芯片的制造成本更低；于用户而言，芯片体积减小、功耗更少。

而目前芯片制造工艺普遍停留在10nm，7nm工艺则一度被称为“最逼近硅基半导体工艺的物理极限”。因而，麒麟980的7nm工艺，则是走在了手机芯片的前沿。

AI方案各家着眼点不同

手机上的终端AI应用于2017年由苹果及华为带起一波浪潮，二者几乎同时在其主打方案——苹果A11 Bionic与麒麟970中引入了NPU硬件神经计算网路单元，大幅加速终端与边缘AI计算落地时程。

同时期的其他方案供应商，多半只能通过软件来模拟AI功能，这导致一来计算性能不足，使得AI场景在应用时明显会感觉到迟滞，无法随心所欲；二来，AI计算包含了复杂的数学与逻辑计算，需要处理大量的数据，因此缺乏硬件设计的方案在功耗及发热等层面的表现亦更为疲弱；最后，如果是以丢回云端处理再回传结果的做法，除了迟延性的问题，云端存储个人数据所建立的学习模型，又可能牵涉到个人数据隐私疑虑。也因此，诸如苹果或华为的本地端AI方案也就成为手机AI发展主流。

以硬件NPU而言，A11Bionic的神经网络专用加速模块比较特殊，目前只用在了Face ID人脸解锁上，没有开放给第三方。而华为的NPU则是支持了标准AI框架，并且对第三方开发者开放，由此所衍生的整体生态效应非常具有想象空间，也可看出华为极力打造自有AI生态的强烈企图心。

即将在2018下半年推出的新款手机方案中，硬件AI计算单元基本上已经是必备要件，这主要归功于苹果和华为带动的潮流效应，而可以预期的是，苹果与华为也必定会在此处持续加强，以延续先前的优势。但联发科等追随者也不甘示弱，AI计算单元成为其主流芯片方案中的标配功能。联发科将采用与高通同样的GPU与DSP混合计算，这种设计虽然弹性高，但能耗表现并不漂亮，而高通则传言未来将全面走向硬件AI计算设计。

手机成为全能接口：他傻瓜你聪明背后隐藏庞大商机

为什么要重视AI在手机上的发展？各家厂商或方案公司之所以争先恐后要推出相关产品，主要就是因为手机是作为日常陪伴用户时间最长的消费类电子产品，其上捆绑的应用已经成为用户黏着性最高的商业接口，不论是游戏，或者是智能语音服务，其对接的是庞大无比的商机，任何对此趋势有基本认知的厂商都不会轻易放过这块市场大饼。

这些所谓的AI功能，其目的之一就是为了带给消费者更便利的日常生活，尽量用最少的程序就可以完成最大多数的工作步骤，很多关键问题的判断就是交由AI来处理。换言之，通过AI辅助，麻烦琐碎的工作都交由手机来代劳，使用者只要动动手，甚至连动手都不用，动口就好。

然而AI并不是先天就什么都懂，它必须通过训练才能获得处理这些工作流程的“知识”，在主流的AI神经网络框架中，我们可以通过对庞大样本的观察与学习，训练出可解决特定应用问题的模型。而这也是包含华为在内的各大手机厂商所努力的方向。

即将引入硬件NPU的高通

作为全球最大的手机方案供应商，高通过去通过Hexagon与GPU、CPU协同工作，达成对主流AI框架的计算加速能力，虽然在效率上还是明显落后苹果与华为的硬件方案，但总是给市场一个交代。

然而，异构计算（Heterogeneous computing）虽然弹性高，且可以有效利用芯片中的不同类型计算架构，但目前AI计算方案讲求的是更高的能效表现，而在手机等移动终端上，更显重要，虽然高通的异构计算已经属于相当高效的技术，但仍与ASIC有一定的落差，也因此，在使用针对AI加速框架进行性能的评比应用时，高通很明显要落后采用硬件NPU的竞争对手，未来如果AI模型往更复杂的方向发展，或者是同时需要执行多种AI服务，那么在发展空间上就可能会明显不如竞争对手了。

不过，高通也不是不知应变，根据市场传闻，其在下一代中高端方案骁龙700系列中，将引入硬件NPU设计，而如果成真，其下一代高端方案，也就是骁龙855，也将可能沿用同样的方式。

而目前高通也引进了包含商汤等多家AI算法设计公司所设计出来的应用框架，想要快速冲刺相关市场，不过高通目前的AI性能还有相当大的改善空间，如果要负载更复杂、多元的AI计算，恐怕还是要等到下一世代的AI设计问世。高通将在12月正式发布新一代的高端AI手机方案，按照往例，明年初就可以见到实际终端产品。

三星：走出自己的路

三星作为全球最大的手机厂商，其势力涵盖终端、消费、云端服务、半导体制造与设计等领域，而其中，手机市场是其最重视的一块，而为了推动其手机市场的布局，三星过去亦步亦趋的追随包含苹果与高通的步伐，并将学习到的设计精髓转化为自有的方案设计。

目前三星主要的芯片来源包含了自行设计的Exynos系列、高通的骁龙系列、联发科的低端MT系列，以及展讯的SC系列，市场从最高端，到最低等级，以及可能会被我们直接当作电子垃圾的产品，几乎都有覆盖。

目前Exynos 9810是三星的主力自产高端产品，今年的Galaxy S9系列、Note9系列都可见到其身影，其采用的AI计算方式与高通类似，主要是通过DSP、GPU与CPU的协同计算，不过三星有个特殊的做法，那就是视觉相关的处理交由硬件，而非异构计算。

目前的9810采用脱胎自Cortex-A75的M3定制架构，并搭配Cortex-A55作为小核心，而与华为最大的不同是，三星在GPU规模上相当舍得下工本，其Mali-G72核心数量配置高达18个，比麒麟970多出6个，虽然芯片成本会较高，但可以在较低的时钟频率达到更稳定、更好的效能表现，换言之，能效也更好。

而9810中有个VPU计算单元，顾名思义，是用来处理视觉方面的计算工作，这个单元应该是硬件设计，但只能用来处理比较固定的功能，三星也未公开发布任何支持该计算单元的可编程或开发套件框架。

而下一代方案，也就是Exynos 9820，将会采用ARM DynamIQ架构设计，并且将以“2+2+4”三丛集形式打造，其中两组大核将采用三星第四代自主架构“M4”，第二道两组大核则以ARM Cortex-A75构成（也可能以Cortex-A76取代），而小核部分则将以4组ARMCortex-A55构成。

AI部分则将可能维持9810的做法，那就是采用VPU硬件处理单元来处理部分视觉计算工作，并搭配既有的异构计算方式来处理标准AI计算框架，也就是半软半硬的方式。

最后，9810采用的是三星10nm工艺，而9820将可能是三星7nm案首发，但因为三星的7nm采用EUV技术，目前还在调试中，真正量产最快也要今年底或明年初，这也可能让9820成为最晚推出的次世代AI手机芯片方案。

赚走最多钱的手机公司搞AI ——苹果

苹果基本的手机芯片布局是每年一款，当然，为了配合如平板电脑或者是手表等其他终端的产品时程，也会在不特定的时间点发布相关方案。而苹果最新的手机芯片是去年发表的A11 Bionic，内建的硬件NPU是最大特色。而苹果在其芯片中往往都使用较少的核心，相较对手都已经走到8核以上，苹果A11还只是个6核产品，但其表现出来的性能数据却远远超越所有竞争对手，其原因包括苹果对其使用的Arm架构深度定制化，并舍得为了特定性能目的来堆加更多晶体管，因此其芯片制造成本往往也都比同时期的手机芯片方案更高。但此策略成功推动手机的销售，并创造更高的获利，因此每一代方案苹果也就更舍得堆料，形成正向发展。

A11使用的是台积电10nm工艺，这也是少数几次没有使用到三星代工工艺的苹果芯片，由于目前苹果的开发套件中，只开放GPU计算能力给开发者，而GPU也负担包括第三方AI应用的训练或推理的工作，对苹果而言，GPU的份量也越来越重要，这也是之所以苹果要推动自有GPU架构的发展。

虽然目前所采用的PowerVR架构在性能与菜单现上相当出色，该公司也愿意配合苹果进行高度定制工作，但这对于苹果而言仍远远不足，而展望未来苹果对其GPU架构的布局，将可能是个结合绘图、计算以及推理、训练的全功能AI优化设计，当然，为了能耗表现，推理工作可能还是维持独立的NPU单元来进行。

而未来A12将会如何？其实在现阶段也只能猜测，唯一能确定的只有使用7nm制造工艺这点。而在架构方面，根据过去的惯例，性能的增长肯定是不能忽略的，毕竟对手也都在积极追赶，今年对手的主流方案都已经在整体性能上有相当大的改善，也拉近了与A11的距离，A12肯定会在CPU与GPU方面进行更深度的改造，不论是增加更多的处理管线，更优化CPU或GPU内部的流水线设计，抑或者粗暴的堆加核心，都是可能的做法。

至于在关键的AI硬件单元方面，除了强化效率以外，也可能就规模方面进行扩展，借以压制华为或高通等即将面世的下一代AI方案。

来源：中国航空报

网友评论文明上网理性发言0条评论