蓝海长青—强军梦 中国梦

首页 蓝海资讯 创新前沿

华为麒麟980创6项全球第一,开启手机终端AI应用竞速赛

作者:于平 2018-09-07618

近日,在2018德国IFA展会上,华为消费者BG CEO余承东以“奇点将至”之名,正式发布了麒麟980。作为全球首款量产的7nm手机芯片、双NPU加持,麒麟980共拿下全球六项第一,相比上一代旗舰——10nm工艺制程的麒麟970980性能提升约20%,能效提升约40%,逻辑电路密度提升60%,即原来的1.6倍。

 

 

 

众所周知,传统芯片遵循摩尔定律,以提升单位面积内晶体管的数量,来提升芯片的性能。工艺提升,于企业而言,芯片的制造成本更低;于用户而言,芯片体积减小、功耗更少。

 

而目前芯片制造工艺普遍停留在10nm7nm工艺则一度被称为“最逼近硅基半导体工艺的物理极限”。因而,麒麟9807nm工艺,则是走在了手机芯片的前沿。

 

AI方案各家着眼点不同

 

手机上的终端AI应用于2017年由苹果及华为带起一波浪潮,二者几乎同时在其主打方案——苹果A11 Bionic与麒麟970中引入了NPU硬件神经计算网路单元,大幅加速终端与边缘AI计算落地时程。

 

同时期的其他方案供应商,多半只能通过软件来模拟AI功能,这导致一来计算性能不足,使得AI场景在应用时明显会感觉到迟滞,无法随心所欲;二来,AI计算包含了复杂的数学与逻辑计算,需要处理大量的数据,因此缺乏硬件设计的方案在功耗及发热等层面的表现亦更为疲弱;最后,如果是以丢回云端处理再回传结果的做法,除了迟延性的问题,云端存储个人数据所建立的学习模型,又可能牵涉到个人数据隐私疑虑。也因此,诸如苹果或华为的本地端AI方案也就成为手机AI发展主流。

 

以硬件NPU而言,A11Bionic的神经网络专用加速模块比较特殊,目前只用在了Face ID人脸解锁上,没有开放给第三方。而华为的NPU则是支持了标准AI框架,并且对第三方开发者开放,由此所衍生的整体生态效应非常具有想象空间,也可看出华为极力打造自有AI生态的强烈企图心。

 

即将在2018下半年推出的新款手机方案中,硬件AI计算单元基本上已经是必备要件,这主要归功于苹果和华为带动的潮流效应,而可以预期的是,苹果与华为也必定会在此处持续加强,以延续先前的优势。但联发科等追随者也不甘示弱,AI计算单元成为其主流芯片方案中的标配功能。联发科将采用与高通同样的GPUDSP混合计算,这种设计虽然弹性高,但能耗表现并不漂亮,而高通则传言未来将全面走向硬件AI计算设计。

 

 

 

手机成为全能接口:他傻瓜你聪明背后隐藏庞大商机

 

为什么要重视AI在手机上的发展?各家厂商或方案公司之所以争先恐后要推出相关产品,主要就是因为手机是作为日常陪伴用户时间最长的消费类电子产品,其上捆绑的应用已经成为用户黏着性最高的商业接口,不论是游戏,或者是智能语音服务,其对接的是庞大无比的商机,任何对此趋势有基本认知的厂商都不会轻易放过这块市场大饼。

 

这些所谓的AI功能,其目的之一就是为了带给消费者更便利的日常生活,尽量用最少的程序就可以完成最大多数的工作步骤,很多关键问题的判断就是交由AI来处理。换言之,通过AI辅助,麻烦琐碎的工作都交由手机来代劳,使用者只要动动手,甚至连动手都不用,动口就好。

 

然而AI并不是先天就什么都懂,它必须通过训练才能获得处理这些工作流程的“知识”,在主流的AI神经网络框架中,我们可以通过对庞大样本的观察与学习,训练出可解决特定应用问题的模型。而这也是包含华为在内的各大手机厂商所努力的方向。

 

即将引入硬件NPU的高通

 

作为全球最大的手机方案供应商,高通过去通过HexagonGPUCPU协同工作,达成对主流AI框架的计算加速能力,虽然在效率上还是明显落后苹果与华为的硬件方案,但总是给市场一个交代。

 

然而,异构计算(Heterogeneous computing)虽然弹性高,且可以有效利用芯片中的不同类型计算架构,但目前AI计算方案讲求的是更高的能效表现,而在手机等移动终端上,更显重要,虽然高通的异构计算已经属于相当高效的技术,但仍与ASIC有一定的落差,也因此,在使用针对AI加速框架进行性能的评比应用时,高通很明显要落后采用硬件NPU的竞争对手,未来如果AI模型往更复杂的方向发展,或者是同时需要执行多种AI服务,那么在发展空间上就可能会明显不如竞争对手了。

 

不过,高通也不是不知应变,根据市场传闻,其在下一代中高端方案骁龙700系列中,将引入硬件NPU设计,而如果成真,其下一代高端方案,也就是骁龙855,也将可能沿用同样的方式。

 

而目前高通也引进了包含商汤等多家AI算法设计公司所设计出来的应用框架,想要快速冲刺相关市场,不过高通目前的AI性能还有相当大的改善空间,如果要负载更复杂、多元的AI计算,恐怕还是要等到下一世代的AI设计问世。高通将在12月正式发布新一代的高端AI手机方案,按照往例,明年初就可以见到实际终端产品。

 

 

 

三星:走出自己的路

 

三星作为全球最大的手机厂商,其势力涵盖终端、消费、云端服务、半导体制造与设计等领域,而其中,手机市场是其最重视的一块,而为了推动其手机市场的布局,三星过去亦步亦趋的追随包含苹果与高通的步伐,并将学习到的设计精髓转化为自有的方案设计。

 

目前三星主要的芯片来源包含了自行设计的Exynos系列、高通的骁龙系列、联发科的低端MT系列,以及展讯的SC系列,市场从最高端,到最低等级,以及可能会被我们直接当作电子垃圾的产品,几乎都有覆盖。

 

目前Exynos 9810是三星的主力自产高端产品,今年的Galaxy S9系列、Note9系列都可见到其身影,其采用的AI计算方式与高通类似,主要是通过DSPGPUCPU的协同计算,不过三星有个特殊的做法,那就是视觉相关的处理交由硬件,而非异构计算。

 

目前的9810采用脱胎自Cortex-A75M3定制架构,并搭配Cortex-A55作为小核心,而与华为最大的不同是,三星在GPU规模上相当舍得下工本,其Mali-G72核心数量配置高达18个,比麒麟970多出6个,虽然芯片成本会较高,但可以在较低的时钟频率达到更稳定、更好的效能表现,换言之,能效也更好。

 

9810中有个VPU计算单元,顾名思义,是用来处理视觉方面的计算工作,这个单元应该是硬件设计,但只能用来处理比较固定的功能,三星也未公开发布任何支持该计算单元的可编程或开发套件框架。

 

而下一代方案,也就是Exynos 9820,将会采用ARM DynamIQ架构设计,并且将以“2+2+4”三丛集形式打造,其中两组大核将采用三星第四代自主架构“M4”,第二道两组大核则以ARM Cortex-A75构成(也可能以Cortex-A76取代),而小核部分则将以4ARMCortex-A55构成。

 

AI部分则将可能维持9810的做法,那就是采用VPU硬件处理单元来处理部分视觉计算工作,并搭配既有的异构计算方式来处理标准AI计算框架,也就是半软半硬的方式。

 

最后,9810采用的是三星10nm工艺,而9820将可能是三星7nm案首发,但因为三星的7nm采用EUV技术,目前还在调试中,真正量产最快也要今年底或明年初,这也可能让9820成为最晚推出的次世代AI手机芯片方案。

 

 

 

赚走最多钱的手机公司搞AI  ——苹果

 

苹果基本的手机芯片布局是每年一款,当然,为了配合如平板电脑或者是手表等其他终端的产品时程,也会在不特定的时间点发布相关方案。而苹果最新的手机芯片是去年发表的A11 Bionic,内建的硬件NPU是最大特色。而苹果在其芯片中往往都使用较少的核心,相较对手都已经走到8核以上,苹果A11还只是个6核产品,但其表现出来的性能数据却远远超越所有竞争对手,其原因包括苹果对其使用的Arm架构深度定制化,并舍得为了特定性能目的来堆加更多晶体管,因此其芯片制造成本往往也都比同时期的手机芯片方案更高。但此策略成功推动手机的销售,并创造更高的获利,因此每一代方案苹果也就更舍得堆料,形成正向发展。

 

A11使用的是台积电10nm工艺,这也是少数几次没有使用到三星代工工艺的苹果芯片,由于目前苹果的开发套件中,只开放GPU计算能力给开发者,而GPU也负担包括第三方AI应用的训练或推理的工作,对苹果而言,GPU的份量也越来越重要,这也是之所以苹果要推动自有GPU架构的发展。

 

虽然目前所采用的PowerVR架构在性能与菜单现上相当出色,该公司也愿意配合苹果进行高度定制工作,但这对于苹果而言仍远远不足,而展望未来苹果对其GPU架构的布局,将可能是个结合绘图、计算以及推理、训练的全功能AI优化设计,当然,为了能耗表现,推理工作可能还是维持独立的NPU单元来进行。

 

而未来A12将会如何?其实在现阶段也只能猜测,唯一能确定的只有使用7nm制造工艺这点。而在架构方面,根据过去的惯例,性能的增长肯定是不能忽略的,毕竟对手也都在积极追赶,今年对手的主流方案都已经在整体性能上有相当大的改善,也拉近了与A11的距离,A12肯定会在CPUGPU方面进行更深度的改造,不论是增加更多的处理管线,更优化CPUGPU内部的流水线设计,抑或者粗暴的堆加核心,都是可能的做法。

 

至于在关键的AI硬件单元方面,除了强化效率以外,也可能就规模方面进行扩展,借以压制华为或高通等即将面世的下一代AI方案。

 

来源:中国航空报


网友评论文明上网理性发言0条评论