您的位置:www.85058.com > 技术支持 > 力压高通骁龙845?华为麒麟980技术解读www.85058.

力压高通骁龙845?华为麒麟980技术解读www.85058.

发布时间:2019-11-01 15:32编辑:技术支持浏览(130)

    原标题:力压高通骁龙845?华为麒麟980技术解读

    原标题:麒麟980的八大亮点

    北京时间8月31日晚上8:00,华为在德国IFA大展上,正式发布了全新一代旗舰芯片——麒麟980。

    9月5日,华为在上海当代艺术馆举办了以“知·芯”为主题的2018麒麟芯片媒体沟通会,华为fellow艾伟向业界和中国消费者展现华为最新一代卓越人工智能手机芯片——麒麟®980,总结起来,麒麟980有八大亮点,老张认为,凭借这八大亮点搭载麒麟980的华为手机有望将对手甩的更远。

    一周后的9月5日,麒麟980技术沟通会在上海召开。

    www.85058.com 1

    相对于IFA的亮相,华为fellow艾伟对国内媒体进行了更加详细的介绍与讲解,我们也因此得知了更多关于麒麟980的技术细节。“Fellow”相当于华为研发领域序列最高的科学家,在华为8万名技术工程师中仅30余名,艾伟也是华为芯片业务——麒麟的产品规划负责人。

    图:华为fellow艾伟现场介绍麒麟980特性

    下面,就让我用尽可能通俗易懂的文字,将艾伟先生的专业解读“翻译”给大家。

    亮点1、投入远超3亿美元,首次商用7nm工艺的手机SoC芯片

    www.85058.com 2

    据华为fellow艾伟介绍麒麟980是全球最早商用TSMC 7nm工艺的手机SoC芯片,集成了69亿晶体管,实现了性能与能效的全面提升。

    首次商用TSMC 7nm制造工艺

    根据摩尔定律,通过提升工艺来提升芯片性能是最方便快捷的方式,手机芯片也不例外,工艺制程直接影响到性能和功耗表现,先进工艺是性能体验和能效体验的基础。当前业界普遍采用10nm制程工艺,而麒麟980全球首商用最领先的TSMC 7nm制造工艺。与10nm工艺相比,7nm工艺性能提升20%,能效提升40%,晶体管密度提升到1.6倍,实现性能与能效的双重提升。

    只要稍微具备一定IT基础知识的人都知道,在半导体领域,先进的工艺就意味着更高的性能与更低的功耗。不过随着行业不断逼近摩尔定律的“极限”,想要驾驭更先进的工艺,势必需要芯片设计方与代工厂深度合作。

    www.85058.com 3

    目前,手机所使用的芯片普遍采用了10nm制程工艺,而麒麟980则首次商用了领先的TSMC 7nm制造工艺。与10nm工艺相比,7nm工艺性能提升20%,能效提升40%,晶体管密度提升到1.6倍。

    7nm相当于70个原子直径,逼近了硅基半导体工艺的物理极限,麒麟980想要在针尖上翩翩起舞,还需要克服复杂的半导体技术效应及晶体管本身的三维电阻电容带来的影响,其挑战之大超乎想象。为此,华为芯片团队提前3年就启动了7nm新工艺基础研究,集合产业界和华为自身长期积累的先进的IP和系统设计能力,有效解决7nm的一系列工程量产问题。

    在制程工艺升级演进的同时,伴随而来的是对芯片设计的挑战升级,7nm芯片的设计难度大大增加。从芯片工艺上看,7nm相当于70个原子直径,逼近了硅基半导体工艺的物理极限,麒麟980需要克服复杂的半导体技术效应及晶体管本身的三维电阻电容带来的影响。

    为了让最新的7nm制程能够带给消费者稳定可靠的高品质体验,麒麟980在实现高性能和高能效的基础上,还进行了大量可靠性验证。从芯片到整机层面所进行的全方位验证,为手机用户提供最可靠的技术保障。

    艾伟在随后的专访中透露,芯片行业都是应用一代、研发一代、预研一代的“滚动研发”模式,麒麟980的立项时间是2015年,共有1000多位高级半导体专家参与,进行了超过5000次的工程验证。对于外界称华为斥资3亿美元研发麒麟980的消息,艾伟称“芯片行业是一个投入巨大、风险巨大的投资”,并且按照行业规律,伴随每一代工艺的提升,对应的投入都要翻倍。华为对麒麟芯片的投入也是每隔2-3年投入就会翻倍增长的,而且伴随芯片创新,这种投入是一年比一年多,具体到麒麟980的投入并不好界定,但“投入远远超过3亿美元”。

    据艾伟透露华为在今年早些时候实现了麒麟980大规模量产(所以量产应该也早于某挖矿机企业的7nm ASIC芯片),而且华为在这款芯片上的研发投入远远超过业界传言的3亿美元!这也是华为长期坚持对尖端技术持续大投入的体现!

    这也就意味着,全球首款采用7nm芯片的麒麟980,是华为历史上投入最多、创新力度最大,同时也是成本最高,甚至是挑战最大的一代核心处理器。

    www.85058.com 4

    艾伟称,麒麟980挑战最大的,是三年前就要准确判断7nm制程能不能在2018年10月这个时间点量产,如果最后产品准备好了,但芯片因7nm的技术问题未能量产,那么就会造成很大的产品事故。

    艾伟表示从工艺研发成本来看,未来每一次工艺迭代的成本都可能是翻倍,因此5nm,3nm的研发成本非常惊人,如此高额的研发费用需要大量的手机出货来摊平成本,而全球手机市场已经趋于饱和,这样的矛盾只能是说明必须有手机芯片厂商甚至是手机厂商退出市场!“这是市场规律,而非吹牛,这是很明显的趋势!所以余总说未来只有少数手机厂商能存活不会吹牛。”他强调。

    一款芯片的设计周期看似长达三年,但其实工作节奏非常紧密。以麒麟980为例,2015年立项,历经了超过36个月的研发,2016年完成定制特殊基础单元构建高可靠性IP论证,进入SoC工程化验证已是2017年,再去掉早期芯片验证的时间,实际剩下的量产周期仅约半年左右,对于麒麟研发团队而言实际上只有两次机会,也就是只能允许一次投片修正,否则就会影响芯片的正常流片、量产和终端适配,造成产品延期上市甚至是项目失败。

    亮点2、全球首次商用ARM Cortex-A76的芯片

    为此,艾伟表示,“从芯片企业未来趋势来看,伴随创新难度加大、投入加大,成本和风险提升,这个行业的商业回报率越来越低,未来只有少数玩家可以留在牌桌上,‘余总之前预测全球手机品牌越来越少也是基于同样的原因推断’。”

    麒麟980是全球首次实现基于ARM Cortex-A76的开发商用芯片,最高主频可达2.6GHz。Cortex A76是arm公司今年最新发布的处理器架构,它是一款完全重新打造的全新微架构CPU,是“第二代奥斯汀家族”的领军者,代表了一个全新的开始。ARM称它“www.85058.com,是一款具有的笔记本级性能的处理器。

    www.85058.com 5

    Cortex A76是一个乱序超标量内核,前端为乱序4发射指令解码,后端为13级流水线,执行延迟为11个阶段。ARM在设计了一个“定向预测获取”单元,这代表分支预测单元会反馈到取指单元中。ARM还在业内首创使用了“混合间接预测单元”,将预测单元与取指单元分离,且支持内核中的各模块独立运行,运行期间更易于进行时钟门控以节省功耗。

    我们现在无时无刻不在使用手机,对操作的流畅性和APP响应的及时性也提出新的要求。为了应对这一挑战,麒麟980在首次实现了基于Cortex-A76的开发商用,全新设计Kirin CPU子系统及Flex-Scheduling智能调度机制,并首次商用Mali-G76 GPU,支持LPDDR4X颗粒,主频最高可达2133MHz。

    www.85058.com 6

    华为公布了一些内存延迟和带宽数据:在GeekBench 4的测试中,麒麟980的延迟为138ns,骁龙845为176ns。

    arm还在Cortex A76上引入了第四代预读取单元,每个核心有4个不同的预读取引擎并行运行,查看各种数据模式并将数据加载到缓存中,以更接近完美缓存命中操作的目标。arm在Cortex A76的缓存体系设计上没有做丝毫妥协,在带宽和延迟两个方面都做到了堪称完美的水平,据说可将缓存带宽提高90%之多。

    “2+2+4”三档能效架构

    arm称Cortex A76相比Cortex A75,每周期整数性能和浮点性能可分别增长25%和35%,再加上高达90%的缓存带宽提升,Cortex A76的GeekBench4跑分提升了28%,Java性能提升了约35%(Octane,JetStream)。

    CPU方面,麒麟980首次实现基于Cortex-A76的开发商用,与上一代相比单核性能提升75%,能效提升58%。麒麟980还全新设计了Kirin CPU子系统,除了在CPU核心上针对终端业务进行了适配和优化外,对CPU调度算法、总线设计等细节均进行了深度设计,保证Kirin CPU子系统从SoC整体设计上,更大地发挥出性能和能效优势。

    可以说Cortex A76是arm公司迄今推出的最强悍CPU,艾伟表示麒麟980首次实现基于Cortex-A76的开发商用,与上一代相比单核性能提升75%,能效提升58%。

    Kirin CPU子系统推出了Flex-Scheduling智能调度机制,设计了2超大核(基于Cortex-A76开发)、2大核(基于Cortex-A76开发)、4小核(Cortex-A55)的三档能效架构。相对于传统的大小核两档位设计,三档能效架构提供了更为精确的调度层次,让CPU在重载、中载、轻载场景下灵活适配,大大降低了CPU在实际综合业务场景下的功耗。

    www.85058.com 7

    www.85058.com 8

    亮点3、麒麟架构大调整,首次使用2+2+4多核布局

    举个简单的例子,如果只是上班路上听听音乐,那么调用小核就搓搓有余。而晚上睡觉前躺着刷微博、购物等社交场景,大核也足以应对。但遇上玩游戏,特别是大型3D游戏,就必须启动超大核,甚至多核全开。灵活的调度策略可以在性能体验和功耗控制间找到最佳平衡。

    从麒麟920开始,麒麟系统一直采用4+4大小核架构形式,这次在麒麟980上,华为首次推出了Flex-Scheduling智能调度机制,创造性地设计了2超大核(基于Cortex-A76开发)、2大核(基于Cortex-A76开发)、4小核(Cortex-A55)的三档能效架构。

    www.85058.com 9

    www.85058.com 10

    全新Mali-G76 GPU,能效提升178%

    艾伟表示相对于传统的大小核两档位设计,三档能效架构提供了更为精确的调度层次,让CPU在重载、中载、轻载场景下灵活适配,大大降低了CPU在实际综合业务场景下的功耗,力求让用户获得更高性能体验的同时获取更长的续航体验。

    在麒麟芯片的“传统弱项”GPU方面,麒麟980首次商用了Mali-G76 GPU,与上一代相比性能提升46%,能效提升178%。其AI调频调度技术,能够实时学习帧率、流畅度和触屏输入变化,预测手机任务负载,动态感知手机使用过程中存在的性能瓶颈,及时进行调频调度。

    www.85058.com 11

    尤其是在游戏场景下,使用AI调频调度技术预测游戏每帧负载,预测准确性相对于传统预测方法可以提升30%以上,有效提升了游戏平均帧率,大幅降低游戏抖动率,减少游戏卡顿,这对于手游用户来说至关重要。

    下图列举了各种应用与多核中间的关系,可以看到,高性能大核应用确实很少更多的是高效能大核和小核组合使用。

    而基于Mali-G76的麒麟980与GPU Turbo带来的新“软硬”系统级整合,图形效能终于可以对骁龙旗舰完成逆转超越。

    www.85058.com 12

    www.85058.com 13

    艾伟表示华为首次推出的Flex-Scheduling TM智能调度机制可以自动实现平缓的CPU调度,让系统能效更合理,从而实现流畅的长续航体验。

    从华为公布的数据来看,以3D手机游戏《NBA2K18》为例,麒麟980平均帧率接近60FPS,游戏整体体验超过业界同期水平。

    亮点4首次商用Mali-G76 GPU

    艾伟表示:“今年10月16日首发搭载麒麟980处理器的华为Mate 20,将是年内能买到的性能最好的旗舰手机”。为什么有这样的自信?艾伟向我们透露:“余总在内部经常讲的一句话就是:‘没有足够的创新就不要做了’,每年手机产品线都有不少被余承东‘腰斩’的产品,对于麒麟来说,每年迭代的巨大投入之后,有没有足够的创新让产品线满意,让终端用户和市场满意,唯一衡量的标准就是销量与口碑。”

    麒麟980也是在业内首商用Mali-G76 GPU的芯片,Mali-G76 GPU是arm公司在今年6月发布的最新GPU架构,也是Bifrost系列的最新产品,Arm承诺,在台积电7nm工艺的支撑下,使用Mali G76的下一代SoC性能可提高50%。

    第四代自研ISP,拍照能力继续突破

    www.85058.com 14

    作为手机日常使用的核心功能,拍照能力的提升一直是麒麟芯片关注的重点。麒麟980采用了全新升级的第四代自研ISP,像素吞吐率比上一代提升46%,能够分区域调节图像色彩与灰阶;与麒麟970相比,支持更多摄像头,适配多摄像头带来全新拍照体验。

    Mali G76重点改善了三个关键指标,首先是性能密度提高了30%,这意味着GPU面积不变,性能可提高30%;或者在性能相同时,可缩小约24%的GPU面积。其次,Mali G76的微架构效率提升了30%,最后,Arm为Mali G76添加了新的专用8位点积指令。

    此外,麒麟980还推出全新HDR色彩还原,能够分区域调节图像色彩,实现照片色彩与细节的平衡。

    www.85058.com 15

    www.85058.com 16

    根据arm的数据,Mali G76为了进一步提高架构的性能和面积效率,将GPU内的基础计算模块的规模增加了一倍,单个EU内拥有8组FMA和ADD/SF流水线。全新EU结构的面积并没有大幅增加,相比前代只提升了22%,但性能却得到了显著提升。

    针对暗光拍摄场景,麒麟980采用全新Multi-pass多重降噪技术,精准降低夜景照片中的噪点,细节保留更加完整,夜拍效果更加通透清晰。同时,运动场景下大幅提升跟踪准确率,在拍摄运动中的人物时,人脸识别检测率提升至97.4%。

    艾伟表示采用Mali-G76 GPU的麒麟980与上一代相比性能提升46%,能效提升178%。在解释为何麒麟980GPU能效有如此高的提升时他表示GPU并行度是很好的,理论上GPU只要堆核就可以把能耗降下来,因为做同样的图形运算,核多了,主频可以降下来,因此能效提升可以很高。

    www.85058.com 17

    www.85058.com 18

    视频方面,麒麟980采用视频专用的Pipeline“处理流水线”技术提升视频清晰度,视频拍摄时延降低33%。稍显遗憾的是麒麟980的视频编码能力,仍然维持在4K@30fps的水平上,对于一款全新的SoC来说不够完美。

    GPU性能的提升带来的好处就是用户APP打开响应升级这是对比

    www.85058.com 19

    www.85058.com 20

    双核NPU,每分钟识别图像4500张

    此外,他表示麒麟980创新性引入AI调频调度技术,能够实时学习帧率、流畅度和触屏输入变化,预测手机任务负载,动态感知手机使用过程中存在的性能瓶颈,及时进行调频调度。尤其在游戏场景下,使用AI调频调度技术预测游戏每帧负载,预测准确性相对于传统预测方法可以提升30%以上,有效提升了游戏平均帧率,大幅降低游戏抖动率,减少游戏卡顿,为手游用户带来操作流畅、不卡顿的卓越游戏体验。

    在双核NPU的移动端算力加持下,麒麟980能使人脸识别、物体识别、物体检测等AI场景,采用更高精度的深度网络,具备更佳的实时性。实现每分钟图像识别4500张,识别速度相比上一代提升120%;多人姿态估计实时帧率高达30 FPS,无论是表演节奏感极强的舞蹈,还是在镜头前快速跑步,都能够实时绘制出人体的关节和线条;强大的物体检测能力可以准确识别多种物体,并可以做到拍照预览的实时物体跟踪。

    www.85058.com 21

    www.85058.com 22

    www.85058.com 23

    麒麟980还带来了“慧眼2.0”,在手机视觉入口提供了一个“感知、测量、认知、计算”的端到端完整解决方案,人工智能技术深度参与视觉处理的各个环节,通过后台基础算法的极大提升和流程优化,让用户明显感知到体验的大幅增强。

    以3D手机游戏NBA2K18为例,麒麟980平均帧率接近60FPS,游戏整体体验远超业界同期水平,让手机轻松驾驭重载大型游戏,带来满帧畅爽游戏体验。

    本文由www.85058.com发布于技术支持,转载请注明出处:力压高通骁龙845?华为麒麟980技术解读www.85058.

    关键词: