揭秘华为GPU Turbo技术:真的比高通Adreno还牛?

来源:雪球App,作者: 手机技术资讯,(https://xueqiu.com/3075605687/113926029)

写在前面:

其实这次 AnandTech 评测华为 GPU Turbo 的文章还是比较受关注的,毕竟知乎上这么多把 GPU Turbo 吹上天的答案都得了高票,而且在华为并没有公布这项技术的细节的情况下,各种 YY 其中技术有多么精妙,我甚至听人说华为早就在各代 Kirin 芯片中预留了一些寄存器,就是为了这次大招...

这文章发布的时候,我也在知乎想法里发了个小短篇,总结了一下 GPU Turbo 的一些小细节。就 AnandTech 的研究成果,简单总结 GPU Turbo 实际上是华为那一头通过神经网络对每个游戏进行训练,得到特定的模型,然后更新到固件中,推送给华为用户。这个训练过程,其实是为了帮助 Kirin 的 Mali GPU 找到游戏中每一刻功耗与性能的最佳甜蜜点,以此实现能效的提升。

华为手机用户本地的 NPU 则负责执行(inference)这个模型,起到硬件加速的目的。如果是像 Kirin 960 这些不带 NPU 的 SoC,则退而求其次改用通用计算的 CPU 来执行。理论上针对每款游戏、每款 SoC 都需要训练,然后把得到的模型更新给用户。

这个解决方案其实还是挺有意思的,也是行之有效的,而且的确能够在游戏体验上获得提升,这也是国内很多媒体肯定了的。但悲剧的是,华为宣传中提到 60% 的性能提升与 30% 的功耗下降,被 AnandTech 的编辑大肆批判了一番,看得我都觉得这人有点啰嗦。60% 和 30% 这两个数字的来源其实是非常诡异的,很不幸被 AnandTech 给发现了,有兴趣的各位请在文章中找。

另一方面,AnandTech 在测试中有一些意外发现,比如他们发现 Adreno 运行的《绝地求生》游戏画质明显优于 Mali 设备,原来是 Mali 设备彻底无视了各向异性过滤,所以负载甚至还更低,但即便如此依然跑不赢 Adreno,详情也在文章中看吧。

这篇文章基本上没什么技术门槛,适合全民阅读。个人水平有限,翻译若有贻笑大方之处,还请不吝赐教。原文题为:Huawei’s GPU Turbo: Valid Technology with Overzealous Marketing

正文开始

今年,对华为而言最大的新闻莫过于 GPU Turbo 技术了。华为宣称,这项技术能够在不改变硬件的情况下,以更低功耗达到更出色的性能。这还是让我们觉得很不可思议的,我们内部许多人都在翘首企盼。今年的 IFA 大会上,我们和华为也聊了聊,加上一些测试,我们对于这项技术有了基本的理解,当然还有华为的营销策略——某些宣传可能并没有那么真实。

GPU Turbo:时间线梳理

按照华为的说法,GPU Turbo 是种新机制,它在提供出色性能的同时,还能保证功耗下降——新旧设备都支持。这项新“技术”最早是在今年 6 月发布的,当时华为在中国发布荣耀 Play。另外在今年后续的 EMUI 9.0 系统版本中,还将有个 2.0 版本上线。

在接下来的几个月时间里,华为计划针对旗下所有主流设备应用这项技术,包括先前的一些产品。华为表示,无关乎硬件,这些设备都将从 GPU Turbo 技术中受益。

在首批受 GPU Turbo 技术支持的设备发布的前几周,我们就看到了有关 GPU Turbo 铺天盖地的宣传。包括各种宣传、新闻稿、一堆所谓的分析文章,但实际上在此期间,始终都没有有关 GPU Turbo 的技术分析,比如 GPU Turbo 是怎么工作的。一切都是相关“结果”的,没有一点是相关“细节”的。对 AnandTech 而言,“细节”才是大家关心的。

值得赞扬的是,华为尝试和我们取得联系,只不过在我们问到有关 GPU Turbo 更多技术细节时,华为公司和公关都没有做出有效的回应。我们不知道原因在哪里,因为这家公司以前其实对技术讨论还是比较公开的。另一方面,今年的 IFA 大会上,我们有机会和华为的硬件和软件工程师/管理人员团队进行了一次会谈。

在这些碰撞中,我们还是发现了一些细节解释的,这些也基本符合华为前几个月的宣传。另外,我们对于 GPU Turbo 究竟怎么工作,也有了一个更好的理解,只不过华为在营销方面也着实有些夸张。

在这篇有关 GPU Turbo 的文章中,我们将分成几部分来聊聊这一技术。首先,我们要看看华为对于这项技术的宣传,尤其是宣传中提到的那些数字。第二,我们会深入去聊 GPU Turbo 是如何工作的。第三,我们也对应用了这项技术的相关设备进行了测试,发现其中的差异,以此说明为什么华为的宣传有夸大之嫌。

需要指出的是,若时间和资源允许,我们还会对 GPU Turbo 进行进一步挖掘。在华为 Mate 20 及其搭载的最新 Kirin 980 SoC 发布之际,我们也想对更多数据进行细节分析。所以这篇文章也只是 GPU Turbo 技术的一个开篇。

传说中的 GPU Turbo:先看华为自己的数据

有关 GPU Turbo 流传最广的数据,应该是华为宣称 GPU Turbo 可以某种方式获得 60% 的性能提升,同时还能减少 SoC 至多 30% 的功耗。华为对这个数字的宣传显然是不遗余力的。

上周四的 IFA 荣耀 Play 发布会上,华为又提了一次这个数字。在过去几天中,我也看到了大量媒体报道这一数字,并将其归功于 GPU Turbo 带来的提升。只不过仍然没有任何可靠的分析内容。

其实像下面这样的幻灯片,我们看过得也不少。要是单纯地在文章里摆个数据,那是很容易的事情:

不过 AnandTech 毕竟是个技术向的媒体,从一开始我们就对这组数字就持怀疑态度。我们对于自己能独立进行分析,验证是否与厂商宣传中的数据一致,一直是相当自豪地。但总的来说,像这样的数字,已经与我们常规认知的工程进步相悖了。所以这组营销数据的破灭,也就不难想见了。

什么是 GPU Turbo?我们得到的信息

最初意欲了解有关 GPU Turbo 的细节信息时,刚开始我们希望自己去搞清楚。毕竟除了华为提供的宣传资料以外,信息量很有限,所以要着色工作也很有难度。另外还有个原因让我的分析工作受阻:先前那么多年,华为的设备都能执行 root 操作,但在 GPU Turbo 发布的几乎同时,华为和荣耀不再支持 bootloader 解锁。这样一来,用户也就无法修改系统固件了,我们也就不能对设备执行 root,并进一步通过基准测试来辅助了解其中的机制了。另外,所有搭载 GPU Turbo 的新固件据说都将广泛上锁。我们不清楚这两件事情之间是否有直接关联,估计一些相信阴谋论的人还是会将两者联系起来。

原本我还想通过 ARM 的 Streamline 工具来了解华为的 GPU 是怎么工作地,这款工具可以给出 GPU 工作负载的确切信息,我们也就能够更深入地进行分析了。然鹅,bootloader 锁定之后,我们也就只能作罢了。由于这些限制的存在,我的测试基本也就告吹了。

虽然无法提供细节信息,但当时我已经开始写这篇文章了,好在我们在 IFA 大会上和 EMUI 软件团队碰了个面,我们得到了一些有关 GPU Turbo 如何工作更广泛的解释。硬件、软件团队都和我们讨论了这一技术,和双方的探讨差异还挺大。

就硬件团队这篇——尤其是和海思的对话——他们表示,这是个纯粹的软件技术。GPU Turbo 中的机制,由其相应的控制作辅助,但 GPU Turbo 的实际工作方式都依托于软件。这也解释了为何华为能将这项技术应用到旗下大量智能机产品中。而且这项技术与 NPU 并无关联,即便 NPU 的确能够起到辅助的作用。

但 Kirin 980 的幻灯片提到了“AI 加载预测技术(AI Loading Prediction Technology)”,这似乎有所暗示。

这张幻灯片阐述的是,GPU Turbo 会让 SoC 更好地追踪运算负载,并对硬件性能状态做出调整,以更好地适应负载。比如说,当 CPU 相较 GPU 需要更多的功耗时,功耗比就会做出调整,以适应工作需求,起到同时提升性能和能效地作用。

下面我们将更进一步挖掘,来解释这一机制的工作。这里我们要感谢华为 CBG 软件总裁 Wang Chenglu 博士提供的信息。

有关 GPU Turbo 的解释

实际上,华为针对不同的游戏,采用预先训练的 TensorFLow 神经网络模型。在针对一款游戏长达成千上万小时(真实或模拟)的详细测试之后,神经网络就能构建其自有模型。这个模型相关于游戏如何运行,还有其功耗/性能需求。起最终结果用一句话概括就是:

采用神经网络,针对每款设备、每款游戏的 DVFS 优化控制(动态电压频率调整)

在训练(training)阶段,神经网络会对 SoC 的 DVFS 参数进行分析和调整,以期实现以最小的功耗达到最佳性能。也就是说,针对 CPU、GPU 和内存控制器,尽其所能地达到某种最佳 DVFS 状态:在维持 60fps 帧率的情况下,不浪费更多性能。最终结果就是,对 CPU/GPU/DRAM 需要管理的每个工作单元而言,相应的硬件模块对功耗需求有着几近完美的优化。这实际上是性能和功耗的,主体上会对后者有帮助。

最终得到的模型,就会包含到设备固件中。每款游戏,针对每个智能手机都会有个特定的网络模型,毕竟不同游戏的负载和不同手机的资源都是不同的。就我们对这项技术的理解,设备本身在应用和 GPU 驱动之间应该会有个监听层,监听渲染调用。这些作为神经网络模型的 input 存在。由于这些网络模型能够针对特定场景,给出最佳优化过的 DVFS 设定,GPU Turbo 机制因此也就能够应用于硬件,并起到调整 DVFS 的作用了。

实际上,网络模型的 inferencing(执行)是由 SoC 的 NPU 进行硬件加速的。而对于那些不带 NPU 的 SoC 而言,GPU Turbo 则会退而求其次采用 CPU 来执行。这样一来,就有了非常快的预测。其实我很想知道,这一步所产生的渲染延迟有多少,华为表示他们在实施过程中,针对这一领域投入了大量研究,所以应该不会很久。华为确认,上述模型都为 16-bit 浮点精度,也就是说,像 Kirin 980 这样的未来设备,新的 NPU 支持应该会通过 INT8 模型,进行更多的优化。

(译者注:有关什么是 inferencing 的问题,可以参考我翻译的 AnandTech 的另一篇文章:华为海思 Kirin 970 性能剖析:GPU 还烧吗?NPU 真的那么神?(参见本文的 NPU 部分解释))

总的来说,GPU Turbo 着力于 DVFS 机制与渲染管线的配合工作,而且是以更细的粒度。它能够针对未来的帧进行硬件需求的预测,并随之做出调整。这也是为什么,相较更为传统的“reactive”DVFS 驱动,GPU Turbo 宣称有着明显更低的性能抖动。传统的被动 DVFS 驱动只是通过硬件计数器监听 GPU 利用率,随后再进行调整。

更多思考

华为的这套方案很有趣,而且的确是可以获得实际收益的。从中我们可以发掘,如何在有限的功耗预算内,跨硬件实现资源的最佳优化分配,最终实现性能、能效和功耗的最佳平衡。这些更为细节化的解释,在技术上也是合理的,对此我们也没什么异议。在更广泛的技术领域内普及这种技术的确会有革新意义,包括 PC 领域。

这项技术的一个弱势在于,它需要针对每款设备、每款游戏去适配。华为并没有详谈训练一款游戏需要多长时间。GPU Turbo 的首个版本支持《绝对求生》和一款名为《Mobile Legends: Bang Bang》的游戏;第二版,随 Mate 20 一同到来的,游戏支持包括《NBA 2K18》《Rules of Survival》《Arena of Valor(王者荣耀.海外版?)》和《Vainglory》。

(译者注:国内对不同游戏的支持或有差异)

从技术上来说,其支持粒度应该是针对每款 SoC,而非每款设备,虽然不同的设备之间,就散热、存储性能等方面也有不同的差异。很显然,华为对于这项技术还是相当自豪的,即便针对每款游戏分别做出支持会比较慢。毕竟还是没有银弹可言的,理想情况应该是有一个优化的神经网络,可以处理市场上的每款游戏,但我们还是要遵循这个世界的规则。

华为期望以 GPU Turbo 来打开核心游戏市场,显然会有大量的 MOBA 类,包括《绝地求生》《Arena of Valor》之类的游戏会因此获得支持,另外大概也会和 EA/腾讯这样的公司合作针对 NBA 2K18 做出支持。或许在这一路上,某些企业会主动和华为取得联系,让自家游戏作品获得华为手机的优化支持。对此,我们唯一的请求就是,能让我们有个工具对游戏和输出帧率数据进行基准测试。

接下来,我们会就设备来进行针对 GPU Turbo 的分析。我们偶然发现了有关 ARM Mali GPU 游戏渲染和竞品设备间的差异问题。

分析 GPU Turbo 的一些困难

这次我没能针对一台设备,在不带 GPU Turbo 与加持 GPU Turbo 技术两种状态下做参照对比。我能做到的最理想对比是在华为 P20 和荣耀 Play 之间进行的。这两台设备采用相同的 SoC 和内存,虽然其结构设计还是不一样的。

我们手上这两台手机实际上也不光是 GPU Turbo 支持与否的差别,其中荣耀 Play 实际上采用了更新版本的 ARM Bifrost 驱动, r12p0,而华为 P20 则为 r9p0。移动市场的供应商们并不会公开驱动更新文档,所以我们也不知道这两个版本的 GPU 驱动之间有什么差别,以及后续的提升究竟是否有 GPU 驱动更新带来的红利,还是都是 GPU Turbo 造成的提升。

华为 P20(未开启 GPU Turbo)

荣耀 Play(开启 GPU Turbo)

单纯从帧率数字来看,很难看出两台手机的区别。《绝地求生》这款游戏的最高帧率是 40FPS,实际上我们原本应该花更多时间去研究帧率稳定性问题,及其带来的实际游戏体验影响的,不过从经验来看功耗才是最值得我们关注的。

在渲染上述场景时,荣耀 Play 似乎有一定的优势,功耗在约 ~3.9W,相比华为 P20 的 ~4.7W 略少。这个数据是整机功耗,所以还需要考虑到屏幕以及设备其它组件的差异。至少就这个数字来看,功耗差异在 15% 左右。不过我们也不能排除两者其它方面的差别,比如说相同型号的 SoC 其实都还会有功耗/电压的个体差异,这在行业里也比较普遍。

援引华为官方 Kirin 980 的数据:

就这张图来看,GPU Turbo 似乎在能效方面(译者注:上图第二组柱状图时能效对比,功耗除以帧率)有优势,不管这张图反映的情况是否真实,从这张图展示的数据来看,GPU Turbo 也就 10% 的提升,这个幅度的提升倒是和我们测试的值比较接近,却和华为市场宣传中提到的 30% 相去甚远啊。

别轻信宣传数据

这里特别需要指出的是,GPU Turbo 本身并不仅是个营销词汇,实际上它在解决当代 Kirin 芯片孱弱的图形计算器性能问题方面,是真实有效且具有革新价值的解决方案。毕竟 Kirin 在性能及能效方面落后于骁龙的 Adreno GPU。华为也不可能取得 Adreno 授权,所以只能另谋出路,为其 GPU 贡献更多的 die 空间来弥补不足。

但 GPU Turbo 这种技术被华为市场营销做了过分夸大,已经对市场产生误导。接下来我们就会谈到这一点。

从本质上来看,这还是个软件解决方案,用以对硬件做加强。如果硬件本身给不了那么多资源,那软件也推不动。市面上很多误导性的资料都和荣耀 Play 的市场宣传有关。实际上情况是,即便有 GPU Turbo 加持,荣耀 Play 也依然无法与骁龙 845 相较——即便厂商有意这样描绘。芯片世界的鸿沟,还是很难通过软件优化来轻易跨越的,无论新机制本身究竟有多具创新性。

《绝地求生》的遭遇:这对比不公平

在我们《绝地求生》的测试中,某些场景是我们以前的标准测试没遇到过的,所以测试也遇到了不少问题。在比较骁龙和麒麟的过程中,我们还发现了 Adreno 与 Mali GPU 设备在渲染和显示市过程中一个较大的差异。

更细致地说,很显然,我们测试的一加 6 手机(采用骁龙/Adreno 的一款手机)在游戏画质方面远好于其它测试的机型。

荣耀 Play(开启 GPU Turbo)

华为 Mate 10(未开启 GPU Turbo)

一加 6

Galaxy S9(Exynos 9810)

这里有两点值得一提。首先,Adreno 在渲染上明显更锐,从游戏画面看来就感觉好像这游戏用了完全不同的图形 scaling(缩放)算法。在相同测试中,我们针对所有手机,将渲染分辨率设为 720p,随后 upscale 到 1080p。Adreno 最终呈现的画面明显更锐利,而 Mali 手机的感觉就是很糊——这在游戏过程中是可以明显感觉得到的。

还有一点可察觉的差异,其实也更重要,就在于采用 Adreno GPU 的手机开启了各向异性过滤(anisotropic texture filtering),而 Mali 设备似乎无视了这一点,而采用双线性过滤(bilinear filtering)。在像《绝地求生》这样的游戏里,这一点还是非常明显的,会产生较大的画质差距。这两者对图形计算的负载要求是不一样的,所以就有了这样的差距。

(译者注:各向异性过滤,通俗理解就是一个 3D 的贴图,如果我们从一些斜着的角度去观察,可能会有失真的观感,比如模糊、诡异的感觉;而各向异性过滤,以及双线性过滤、三线性过滤都可以缓解这种失真,而各向异性过滤是个加强版,从各角度看都能看到更多细节——像上图这样,左边是三线性过滤,右边是各向异性过滤。各项异性过滤也算是较晚(1990s)下放到消费级显卡领域的标准特性,因为它对图形计算性能比如存储带宽是有更高要求的,这项特性在当代显示硬件中已经比较常见。)

所以实际上,华为 GPU Turbo 市场宣传中的对比也是值得质疑的:各向异性过滤对性能是有影响的,对帧率的影响实际可以达到 16-18%。在 Mali GPU 本身就有这一问题的情况下,Adreno 和 Mali GPU 如果要做性能较为细致的对比的话,本身就是不公平的。换句话说,两者还没开始比,Mali 就已经率先领跑了 16-18%,虽然人家画质也付出了惨痛代价...(Ed: 这在 10 年多以前的 PC 领域也很常见,不同的 GPU 以不同的渲染方式,或者各种玩弄花样减少负载。现在已经不这么干了。)

而且,即便是在 Mali 设备已经偷懒,少干了很多纹理过滤的活儿之后,仍然在性能和能效方面落后于 Adreno 设备。由于最高画质下,这游戏撞顶也就 40 FPS,从这个维度来看差别还是比较小的。所以能效(power efficiency)就成为了一个重要的考察维度。

(译者注:本文不对能效、效能、功效等词作区分,这里的能效并不指以能量(单位焦耳)为分母,可能在计算方法上存在差异,如本文大部分情况下能效是指帧率/功率,实际意义是 GPU 每耗费一瓦功率能跑多少帧;既然上面提到了,大家帧率都撞顶 40FPS,那么其实也就看功率——也就是大部分人所理解的功耗了。)

就能效来看,即便大家渲染方式和质量都有差异,骁龙 845 也具备了很大的优势,开启各向异性过滤依然将功率控制在 2.5-3W,而 Kirin 970 设备平均在 4-4.5W。更高的功耗及更低的能效,自然意味着设备续航要受负面影响了。

实际使用 vs. 跑分测试(Synthetic Testing)

其实我完全理解,华为更专注于实际使用中的体验差异,比如《绝地求生》这样的游戏,而不是去死磕跑分成绩。不过我们还是做了跑分,来看看 GPU Turbo 是否符合宣传。原因很简单,毕竟这些测试是行业标准,也很好理解。在这一方面,华为的扮相就不大好了,下面的内容会谈到。

即便大家没有采用相同的处理方式去做图形计算,但 Adreno GPU 却因为有各向异性过滤而拥有更好的画质。华为的宣传材料中的性能和能效对比显然没有考虑到这些,也就没那么可靠了。

(译者注:突然想冒出来说两句,这事儿和华为其实也没什么关系,三星的 Exynos 也这德性,你让华为在宣传材料里说明,这不是吃饱了撑的吗?而且你怎么说明啊?我们不支持各向异性过滤,我们画质不如骁龙,但我们性能更强啊,这样吗?)

应该说 GPU Turbo 的确是个很有前途的新技术,而且也会给华为带来更大的竞争优势,在大家都平等比对的情况下。悲剧的是拿 Kirin 960 和 970 比,其实就不平等。Kirin 980 还会有更具竞争力的改变,但在此之前,用户们还是需要对 GPU Turbo 有个清晰、现实的认知和预期的。

市场过度宣传的一点小问题

如本文开头所述,我们听到来自华为、荣耀最多的宣传数字就是,GPU Turbo 能够至多提升 60% 的性能,降低 30% 的功耗。在 GPU Turbo 发布之后,在所有的市场宣传材料中,我们发现了其中一个关键点。下面这张图是荣耀 Play 英文全球产品页解释 60%/30% 这俩数字的,其中有个脚注是这么说的:

*2 GPU Turo 是一种图形处理技术,基于 Kirin 芯片,通过软硬件交互结合。它对部分游戏提供支持。测试结果基于上一代芯片,Kirin 960

(*2 The GPU Turbo is a graphics processing technology that is based on Kirin chips and incorporates mutualistic software and hardware interaction. And it supports some particular games.

Results are based on comparison with the previous generation chip, the Kirin 960.)

这一行特别值得注意。一般我们在对比一项新技术的时候,性能差异应该是开启这项技术和关闭这项技术的对比。用 Kirin 960 作为对比明显有问题。也就是说宣传材料中提到的这个数字其实是很奇怪的对比,那么实际上这组数字的提升,并不只是 GPU Turbo 带来的,还与两代芯片本身的代差有关。

靠谱的对比应该是用关闭 GPU Turbo 的 Kirin 970 来对比开启 GPU Turbo 的 Kirin 970。而华为的对比结果是基于关闭 GPU Turbo 的 Kirin 960 来对比开启 GPU Turbo 的 Kirin 970。(译者注:神......)

不熟悉 Kirin 970 的读者可以去看我们 1 月份发布的这颗芯片的深度评测文章。相较 960,Kirin 970 采用更新的 Mali G72MP12 GPU,频率为 747MHz,台积电 10nm 制程。这相比 16nm 生产的 Kirin 960(Mali G71MP8,频率 1037MHz)就提升比较大了。

而且我们之前就提过,Kirin 960 的 GPU 性能和能效问题本来就很严重,可以说是我们见过智能手机有史以来最糟糕 GPU(译者注:参见我之前翻译来自 AnandTech 的Kirin 960 评测)。我们也不想再去回溯问题出在哪儿,但这足够说明 Kirin 960 的 GPU 不怎么样。

而 Kirin 970 是从这样一个低的参照系来做提升。或许 60% 性能提升,30% 功耗降低这俩数字单独来看还挺亮眼的,但在了解参照系之后就会发现根本没有那么美好。实际上针对某一个用户而言(比如你是华为 Mate 10 用户),在更新系统、开启 GPU Turbo 以后,他并不能获得 60%/30% 的提升。

华为在 GPU Turbo 的宣传中一直在强调这两个数字,60%/30% 也各种占据头版头条。华为自己也有数据证明,这 60%/30% 是言过其实的数据:

华为在这张图上呈现了 GPU Turbo 开和关状态的性能差异。如果你希望自己的 Kirin 手机在得到 GPU Turbo 更新后带来游戏方面质的提升,恐怕是要失望的。

而且这张柱状图的柱状条还严重歪曲了事实,在《绝地求生(PUBG)》中仅有 3FPS 的提升,从这张图看来就仿佛提升了 25% 一样。许多公司都觉得有必要像这样呈现增长数据,因为这会造成一种错觉,而不是真的按照比例来画图。

为什么说用 Kirin 960 作对比是个悲剧:参照系太低啊!

回去看看我们的 GFXBench Manhattan 3.1 和 T-Rex 跑分测试,相关 GPU 能效问题(这里的能效,改用),将这两颗芯片做个对比。

Kirin 970 本身相比 Kirin 960 就是有提升的,只不过和同代的 Exynos 与骁龙还存在差距。(译者注:这里的数据,应该是没有开启 GPU Turbo 的,纯粹两代产品在都不开启 GPU Turbo 情况下的对比,这两者本来就有性能方面的差异。)

我想要阐述的关键是,GPU Turbo 宣传中的 60%/30% 就是对消费用户的一种误导。如果华为不能明明白白说清楚对比依据,那么这家公司以后发布的数据恐怕也很难让人采信。

GPU Turbo 真正的提升有多少

周五华为 CEO 余承东宣布新款 Kirin 980 问世,有幻灯片提到了这一机制,其中的数字都明显合理多了。

就 Kirin 980 的对比数据,由于负载受 V-sync 限制,实际的性能提升还是比较小的。不过图中提到的功耗红利仍然相当惊艳,从这张图来看其功耗降低了 10%,就软件的优化而言,这个数字显然要合理、可信多了。

总结:A+,但是...

2015 年的时候,AnandTech 是和海思正式碰面的第一家西方媒体,我们报道了北京发布会上的 Kirin 950。当时我犹记这家公司对待自己的产品非常谦虚,而且自我认知清晰。而过去 3 年,很多事情都变了,华为也成就了相当大的发展。

华为和荣耀两个品牌,现如今一年售出 1.53 亿台智能手机,华为最近取代苹果,已经是全球第二大智能手机制造商了。荣耀品牌则宣称排名全球第五。华为另外还宣布在 5G 竞赛中,R&D 研发预算将从现如今总收益(132.3 亿美元)的 15% 提升到 20-30%。这两个品牌现如今在移动领域都是重要的参与者,而华为的芯片设计团队海思,构建自有 SoC,与其它产品采用高通、MTK SoC 形成差异化竞争。

华为的爆发式增长并不仅体现在研发方面,也在市场方面。这家公司现如今越来越壮大,接连不断在欧洲召开手机发布会,也成为抽样方案(sample???没懂)最庞大的智能手机发布会:所有受邀参加的媒体,大约 500-2000,都是抽样的。类似三星和苹果,只为某些特定媒体提供有限席位,类似 LG 则混合了两种方案。华为期望获得品牌认知和知名度,却过度夸张了 methodology,这是把双刃剑——在技术方面的确提供了创新的方案,而在品牌方面则偏离了其谦逊的本源。

对华为来说,开发像 GPU Turbo 这样地技术是很关键的。相较高通骁龙,华为的确在游戏性能、画质和功耗方面略逊一筹。芯片一直以来,都是 price/perfomance/area 三者权衡的游戏,在提供收益的同事,另外还需要其它配置规格的协调。这也是 GPU Turbo 为什么重要的原因:GPU Turbo 的开发,是从硬件拿到了“真正的(free)”能效红利。通过在软件方面的努力,还让全系列手机都获得提升。GPU Turbo 仍有很长的路要走,比如扩展支持的游戏数量,及基础的潜在提升,比如需要有个算法来应对所有使用场景,未来是光明的。

对 GPU Turbo 这样的技术做市场宣传也很重要。把开了 GPU Turbo 的 Kirin 970,和没开 GPU Turbo 的 Kirin 960 做对比,得出 60% 性能提升、30% 功耗下降这样的数字,而且还不在所有的宣传资料中说明,显然是在混淆视听。与华为自己的某些数据还相悖,比如 Kirin 980 开启 GPU Turbo 获得的性能和能效提升就比较有限。这种提升是完全有价值的,但完全没有华为每次提到 GPU Turbo 时说的那么神乎其神。

华为最近还被抓到检测跑分软件提速获得高分,表明很显然华为想要想要吸引用户眼球。但扮相真是不好看。华为现在正在爆发式成长,公司更应该审视自己,期望公司在主流的舞台上得到些什么。公司越大,就越会因为小事垮棚。所以保持真诚是很重要的,否则用户的信任就会付之东流。给出一个台面上光鲜亮丽的样子,隐藏真实水平,并不会很好看。

针对 GPU Turbo 最后想说的

文章里也提到很多次了,我们获得了 GPU Turbo 更多的细节。我们也可以聊有关这项技术的更多内容,这未来也很可能称谓供应商差异化竞争的催化剂,竞争对手显然也会寻求类似的解决方案。

针对我们所述华为呈现的这项技术,我们期望华为能够给予提出这个点子、开发这项技术的人更多的奖励和荣誉。在竞争的路途上,SoC 制造商都需要差异化、获得省力。而像 GPU Turbo 这样的技术具备革新意义和有时,能够提升整体用户体验。

时间、硬件、软件允许的话,未来我们还会针对 Kirin 980 进行更为翔实的 Kirin 980 测试,包括开启 GPU Turbo 和关闭 GPU Turbo 两个状态。 Stay tuned.

Benchmarking and Core Analysis by Andrei Frumusanu

Extra Analysis and Conclusion by Ian Cutress

全文翻译自 AnandTech:Huawei’s GPU Turbo: Valid Technology with Overzealous Marketing

翻译欧阳洋葱

手机技术资讯(mobile-info)是一个分享手机产品技术的微信公众号,成立2年以来,每年会发布手机行业技术发展趋势,同时会联合志同道合的朋友,分享一些手机及VR/AR/智能穿戴/元器件/材料等方面的相关技术。欢迎大家关注手机技术资讯微信公众号;

从2017年2月开始,为了更好的和手机技术资讯的粉丝和读者交流,我们逐步建立了一系列的粉丝群。

目前1群为手机产品技术群,欢迎手机产业链产品技术人士加入手机技术圈1群;

3/6/7为手机技术群(前期扫码后满100),8群为销售群,5群为智能家居群,9群为VR群,10群为IC群。 后续会将3/6/7整合到1群或者重新开辟一个手机技术群。

2群为结构及材料工艺群,如要加群,请向管理员:t806060279申请; 其他西安/上海/深圳/北京/西安/南昌/成都群请联系各大管理员加入。

请注意,入群申请,请提供行业+岗位+地点给管理员(如手机+结构+深圳)。请同时分享一篇公众号文章到朋友圈,谢谢!

后续,手机技术资讯会开出更多的微信群,如CAM群,结构群或者其他专业群, 也欢迎在各个领域比较突出的人才愿意作为者群助手(或群主,需要一定时间的考验),共同开辟新的交流群。

备注: 文章来源于周三科技,如有侵权,请联系lianjie0706删除,谢谢!


TOP