拳打高通脚踢AMD、Intel,Geekbench 4跑分怎么神话了?

  【PConline 杂谈】苹果今年9月份用全面屏的iPhone X手机证明了自己依然是智能手机市场上的标杆——iPhone的设计是最好的,iPhone的性能也是最强的。也许有人对iPhone的创新设计不以为然,但在性能上没有哪家厂商敢说秒杀苹果的,高通、三星、华为海思都没这个底气。以iPhone 8/8 Plus、iPhone X所用的A11 Bionic处理器(以下简称A11)来说,最近一段时间A11跑分的新闻都要刷榜了,特别是在Geekbench 4测试中,苹果A11处理器单核性能是高通骁龙835处理器的两倍还好,三星Exynos 8895、海思的麒麟960甚至刚发布的麒麟970都望尘莫及。别说吊打安卓阵营了,Geekbench 4还支持X86及Windows平台,苹果A11处理器甚至比Intel的Core i7、AMD的Ryzen 7还要强,这是苹果A11处理器真的这么逆天还是另有缘由呢?

  提到苹果iPhone手机,以往人们夸赞最多的就是iOS系统的流畅,特别是在硬件配置不如安卓旗舰的情况下,比如万年1GB内存就比3G、4GB内存的安卓机还要流畅,单核、双核A系处理器性能也要比高通骁龙800、三星Exynos以及海思麒麟9XX系列处理器强大。不过这几年来iPhone手机的硬件配置也追上来了,iPhone用上了2GB以及3GB内存,A10处理器用上了四核架构,这次iPhone 8及iPhone X的A11处理器则是6核架构,与安卓旗舰的4-8核相差不大了。

  不过苹果A系处理器最让人吃惊的还是它的跑分,特别是在Geekbench中,最新的Geekbench 4测试中完全碾压安卓阵营旗舰处理器,单核性能甚至比AMD、Intel桌面处理器的性能还要强,以致于很多人都对GK4跑分比较盲从,随便搜索一下iPhone 8手机的各种曝光新闻,很多爆料都是在说什么跑分秒杀安卓之类的,鼓吹苹果跑分无敌。这种情况中不论是其他媒体还是玩家,参考的都是Geekbench 4跑分,但是这个软件在跑分vs实际性能上引发过多次争议了。今天我们就来谈谈Geekbench 4跑分到底是如何跑出这些神话的。

  Geekbench 4跑分规则变化及权重

  A11处理器的GK4跑分为何这么神奇?对于这个问题我们还要先了解下GK4的跑分规则。

  Geekbench是一款跨平台CPU性能评测软件,支持安卓、iOS、Linux、OS X及Windows平台,当然最重要的影响力还是移动平台,特别是iOS、安卓上。跨平台基准评测是很多人追求的目标,但是真做起来不容易,因为不同平台使用的是不同的开发工具,除了平台自身之外还要牵涉到编译器。GK4在不同平台就使用了不同的编译器,安卓是Clang 3.8,iOS平台是御用的Xcode 7.3版。

  很多人之前跑过Geekbench 3测试吧,现在的Geekbench 4是最新版测试软件,与GK3相比做了很多调整,把加密性能单独列出来,主要是跑AES加密性能测试,权重占了5%。其他项目还是可以分为三大块,分别是整数、浮点以及内存性能,权重占比分别是45%、30%、20%,大体上跟GK3跑分权重相似。

  不过具体的项目测试中,GK4要比GK3改变太多了,比如GK3的整数测试之前只有SHA、JPG、PNG、BZip2压缩、LUA等寥寥几项,GK4多了LZMA压缩、JPEG、SQLite、LLVM、HTML 5、PDF、Camera之类的测试,应该说要比GK3测试的更全面了。在浮点性能测试上也有类似的改变,增加了一些更常见的测试项目。

  在测试思路及理论上,GK4还是OK的,整数性能对日常使用影响最大,占比也是最高的,不过内存性能测试我认为占比有点高,玩过PC测试的玩家应该知道内存性能对CPU性能有影响,但在CPU基准测试中内存带来的提升不会这么明显,X299这样的四通道平台内存带宽是主流平台的两倍,可这并不会让内存之外的测试性能大幅提升,作为CPU基准性能测试的GK4中内存占到20%比重是有些不太合理的。

  Geekbench 4跑分与其他处理器详细对比

  解释完GK4的跑分之后,我们就来详细看下A11在这个测试中是如何吊打其他处理器的。下图的测试数据源于GK官网数据库,选择的都是各个CPU中得分正常而且较高的,由于A11处理器的单核得分在4200左右,对比的AMD、Intel处理器选择的也是这个级别的。

  Geekbench 4跑分

  CPU型号iPhone 8 PlusA11 Bionic

  iPhone 7 Plus

  A10 Fuion

  Galaxy S8 Plus

  骁龙835

  Intel

  Core i7-6700HQ

  AMD

  Ryzen 7 1700X

  核心/线程6/64/48/84/88/16

  频率?

  2.3GHz*2

  1.05GHz*2

  2.45GHz*4

  1.9GHz*4

  2.6-3.5GHz3.4-3.8GHz

  单核42503386184742514266

  加密分30842265117135085617

  整数分46843807199642573956

  浮点分39563180135540054061

  内存分40063027242047934936

  多核10315564961761428323941

  加密分7689437357861385715930

  整数分13367683681701695229103

  浮点分10335581356901651029165

  内存分40743054251440486511

  现在我们把A11处理器与苹果iPhone 7的A10、高通骁龙835以及AMD、Intel的处理器放在一起对比,重点看的是单核性能,那么结果就是——A11的频率依然是2.XGHz的水平,但是它的GK4单核性能堪称跑分之王,骁龙835的单核性能不足它的一半(对比的是Galaxy S8,如果是擅长跑分的小米6或者一加5,单核还能上2000分),完全被碾压了。仔细看的话,整数性能上A11达到了4684分,骁龙835只有1995分左右,差距甚大。

  A11完胜高通处理器,或许我们可以解释这是高通等厂商太渣,苹果实力无敌,但是苹果的ARM处理器跟X86对比呢?这里选择了Core i7-6700HQ以及AMD Ryzen 7 1700X两款处理器,单核性能也不过4200分左右,跟A11处理器几乎持平——这里我还没有列出Core i7-8700K的单核性能,GK4中它也不过5000分出头,也就是说只比A11处理器高出20%左右。。对一些不明真相的玩家来说,这个成绩足以让人高呼ARM单核性能直逼Intel、AMD旗舰了。

  但是这样的情况是可能的吗?ARM处理器同频架构性能低于X86架构是公认的了,因为二者根本就不是一个体系的,一个重性能,一个重能效,二者放在一起比性能的话,就好比小学生挑战大学生,前者的九九乘法表再熟练,也不可能抵得上大学生的微积分,但在GK4的测试中出现了弱胜强,究其原因就是它们的测试并没有完全发挥出其他处理器应有的实力,特别是对X86处理器来说,其整数、浮点性能都远胜ARM处理器,但GK4的测试负载偏向移动处理器,尽管增加了一些项目了,对X86处理器来说还是有点大马拉小车,并没有发挥出X86处理器的整数、AVX浮点计算能力。

  前面直接批评GK4跑分不准或许有点口说无凭,那我们再换个角度,看看其他跑分软件,这时候就要祭出安兔兔了,尽管安兔兔的跑分也被人调侃过,不过我们这里不看总分,只看CPU相关的得分,因为安兔兔的CPU测试来源于NBench,它在CPU性能测试上还是比较靠谱的,安兔兔跑分被人质疑其实是跟它的评分权重有关系,跟具体测试关系不大。

  安兔兔跑分

  CPU型号

  iPhone 8 Plus

  A11 Bionic

  Galaxy S8 Plus

  骁龙835

  核心/线程6/68/8

  频率

  ?

  2.45GHz*4

  1.9GHz*4

  总分207467159321

  3D性能6017863171

  UX性能6871151268

  内存152518321

  CPU分6332736561

  CPU算术217879765

  CPU算法2103111557

  CPU多核2041815239

  这里借了同事的S8与iPhone 8跑了安兔兔测试,总分上20万分的A11依然远胜骁龙835,CPU分数也是碾压骁龙835,不过整数领先幅度就没GK4中那么夸张了。考虑到S8的骁龙835跑分还要弱于国产机,一加5的安兔兔得分能达到18万多,与A11的差距还能进一步缩小——这同时也说明了跑分这回事在不同厂商那里会有很大的不同,热衷跑分的国产厂商更愿意挖掘处理器的潜力,提高跑分。

  总结:不服可以跑个分,但别神话单一软件

  事实上Geekbench因为跑分结果出现偏差引发的争议不是一次两次了,2015年Linux系统创始人就骂过“Geekbench is Sh*t”。它虽然号称是跨平台CPU性能测试软件,但是它测试出的结果并不一定能准确反应出处理器的性能水平,有时同一平台上也会出现各种悖论结果,而被人诟病最多的就是iOS平台跑分超强,GK3中安卓旗舰处理器的单核分数也能逼近2000分,跟2500分的苹果A9处理器还有的一拼,不过到了GK4中双方的差距越来越大,A10、A11对同级别安卓旗舰处理器就完全是碾压之势了,安卓手机已经没有翻身的可能。

  为什么会出现这样的结果?这个问题就很难解释了,从GK4公布的白皮书以及测试结果来看,他们的测试方法、思路没什么问题,但跨平台测试的结果就比较反常,普通人一旦迷信GK4跑分,单纯用这个结果来对比处理器性能,很容易被误导。

  本文的初衷并不是来论证苹果A11处理器性能不好的,实际上这点上也没得悬念,苹果的A系处理器单核性能一直很强大,以往吃亏的是多核,但是现在也上了四核、六核,多核性能上苹果现在也追上来,甚至用6核轻松赢了8核。在一点上,苹果对自家处理器可谓不遗余力,高通的处理器需要集成基带,而且要考虑成本,所以性能上会有妥协、折衷,而苹果的处理器不对外销售,也不需要集成基带,而且每次都能用上最新工艺,苹果也不惜工本,举个简单的例子就是L2缓存,安卓旗舰处理器最多也就是1-2MB的L2缓存,苹果就大气多了,A11这次就是8MB L2缓存,甚至完全不需要L3缓存了,这点上比Intel桌面处理器还奢侈,Kaby Lake四核处理器也不过是2MB L2缓存。

  从实际测试来看,苹果的A系列处理器性能也确实遥遥领先于其他,GK4以及安兔兔测试出来的大方向是没问题的,我们这里想要表达的其实是希望大家面对跑分要冷静一些,因为衡量处理器性能是个复杂的活,换个测试就会有不同的结果,跑分有助于区分智能手机的性能水平,但是GK4的跑分现在有被神话的危险,希望大家不要唯GK4论,别盲从、神话单一测试结果。