龙八娱乐手机官方首页
  咨询电话:13993230892

龙八国际网页官方线路

再次打败安卓,苹果iPhone XS/Max搭载的A12为何是迄今最强手机芯片?

上个月,苹果正式推出新一代iPhone,包括iPhone XS、iPhone XS Max及iPhone XR。按照苹果的宣传,iPhone XS系列是自家迄今为止最先进的新一代iPhone,实现了智能手机面向未来的一次巨大跨越。不过,三款新品都搭载了强大的A12仿生芯片。对于这枚芯片苹果声称,A12仿生是iPhone迄今最智能、最强大的芯片,采用开创性的7纳米芯片,具有更节能的设计,提供出众的性能表现。

具体到A12仿生芯片内部和性能,苹果没有非常详细的讲解,只是简单的表示A12仿生采用六核心融合架构,与A11仿生相比,两个性能核心的速度提升最高可达15%,四个能效核心的节能最高可达50%,同时苹果自主设计的新四核心图形处理器,其图形性能提升最高可达50%。

那么,究竟苹果口中所说的A12仿生芯片与上一代相比达到宣传的性能提升吗?CPU和GPU实际性能如何呢?只是iPhone迄今为止最强大而已吗?与安卓阵营的SoC芯片相比又如何呢?近日,权威评测站AnandTech对A12进行了相当详细的评测,并认为A12是当前移动领域最强的芯片,我们来看看这份评测报告中讲述了些什么。

第一枚商用的7纳米芯片结构分析

AnandTech表示,在过去的几年里,苹果的芯片设计团队始终引领行业架构设计和制造工艺。Apple A12是苹果又一次飞跃,因为它是全球第一枚商用的7nm芯片。

当谈及工艺制程,一般来说,数字越小,晶体管就越小。尽管近些年更先进的工艺节点已不等于实际更小的物理尺寸,或者说两者无必要关联的意义,但依然可以代表密度的提升。因此,在更先进工艺的芯片内,总是能装入更多的晶体管。

此前,另一专注芯片结构解析的网站TechInsights公布了关于苹果A12的内部图片,因此AnandTech据此发布了一篇简要分析。

AnandTech称,12仍遵循此前苹果SoC芯片的布局结构,在右边可以看到GPU集群,内有四个GPU核心和共享逻辑。而在下边则是CPU的复杂结构,2个大CPU核心靠中间偏左,在其靠右一旁是更大的L2缓存,然后紧挨着4个小CPU核心以及为其配置的L2缓存。

芯片中间是4大块SRAM,作为系统缓存的一部分,位于内存控制器及内部系统互连和块储存器子系统之间,主要当做SoC范围缓存层的作用。苹果利用这块充分实现节能功能,因为DRAM内存交换在能耗使用方面一点不小,直接在芯片内缓存内容可以减少大量的能耗,还能增强性能。

苹果A12芯片的系统缓存发生了自A7推出以来最大的变化,布局上的巨大变化也相当于这块功能上的巨大变化,现在可以清楚地看到这一部被分离成明显的四块。在之前苹果的SoC芯片如A11或A10上,系统缓存看起来更像一个逻辑块,似乎是两块,如今块数增加可能意味着这部分的性能发生了非常大的变化。

最后,A12芯片最重要的变化之一是NPU神经网络引擎的一次重大改造。针对这部分,苹果官方声称已经从A11的双核设计转变为全新的八核设计。去年据一些传闻了解,苹果的NPU设计似乎来自CEVA IP,不过这点从未得到完全的确认,因为苹果也不希望这其中的细节被人所知,而且官方的营销材料多次提到“Apple-designed”,强调这是苹果内部自主IP。

A12采用了8核设计,其实际的理论性能提升接近8倍,从A11的600GigaOPs增加到A12的5TeraOPs。通过对比A11到A12大小的变化,可看到台积电新7nm制程节点带来的好处。需要注意的是,芯片内几乎所有的IP块都发生了变化,所以用很难做有效的对比,尤其是确定新支撑对密度提高是多少。

尽管如此,如果将单个GPU核心作为对比的参考,不难发现,A12与A11相比,其尺寸减少了37%。很明显,新的工艺制程的确帮助苹果在A12内塞进了更多的GPU核心,而且GPU内核在A12中真的非常小。

CPU部分更大了

在CPU综合体部分,参见来自TechInsights和ChipRebel Apple A11的图(下图,前者是A12,后者是A11)。A12新的CPU核心变得更大了,而且这应该是苹果几代A系列芯片以来CPU布局上变化最大的一次。同时,新“Vortex CPU”核心中L1缓存翻了一倍,从64KB增加到128KB。同时,SRAM这块也是之前的双倍大小,其主要归因于L1指令缓存,因为现在已经加到到了128KB。

在大内核方面,全新A12的L1从64KB跃升到了128KB,这里的增长是毫无疑问的。然而,转到L2缓存,AnandTech认为这就有点奇怪了,特别是关于延迟方面。很明显,在3MB范围内,延迟会增加,现在直接到了6MB左右。需要注意的是,只有在完全随机模式下访问时,才会出现较慢的每秒3MB的行为。

AnandTech不打算深入讨论这个问题,而是深入系统缓存服务的6MB以上区域。他们表示,一开始很难弄清楚这一点,因为整体延迟较低会造成偏移,但总的来说,延迟曲线在达到大多数DRAM延迟之前会进一步扩展到4MB左右。这与之前在芯片内部实际看到的情况是一致的,即新系统缓存块不仅加了一倍,而且容量也从4MB到8MB完全增加了一倍。

继续看小内核,之前A11小内核的L2被限制在512KB以内,而A12则高达1.5MB,然而AnandTech认为他们被高速缓存的电源管理策略迷惑了,因为看看A11 Mistral核心延迟,可以看到他们在768KB和1MB之间明显跳跃,但在2MB的A12内核中也可以看到了类似的跳跃。

AnandTech表示,大核心的L2缓存在A11和A12之间没有看到任何结构上的变化,两者都有128个SRAM宏实例,被分成两个块。如果L2确实只有6MB,那么这意味着每个SRAM块为48KB。在小内核中使用了相同的SRAM宏,A12小内核L2已从16个增加到32个,看似增加一倍。然而,L2实测延迟深度至少增加了三倍。总之,在A12上“Tempest核心”似乎只有512KB可用,而A12实际物理系统缓存可能达到了8MB。

引入无损内存压缩技术的GPU更强了

在GPU综合体部分,AnandTech称对A12有很高的期望,不仅在性能方面,而且还包括在架构方面。去年有一份来自Imagination的官方新闻稿称,苹果已经通知他们未来在15至24个月内不再在新产品中使用其IP,事实的确如此。这最终导致了Imagination股票价格暴跌,随后公司被出售给一家公司,而苹果则拥有了自主GPU设计。

苹果宣布A11 GPU自主设计时,其内部看上去仍然非常很像Imagination的衍生设计,因为其块设计非常类似于之前Rogue那一代,仍然是TBDR(基于平铺的延期渲染器)设计,而这方面IMG拥有诸多专利。最重要的事实是,苹果仍然公开支持其专有格式PVRTC (PowerVR纹理压缩),这意味着其GPU仍然可能与IMG的IP有明显关联。在这里,AnandTech认为这不是通常所说的“干净”设计。

至于A12 GPU,参见来自TechInsights和ChipRebel Apple A11的图(下图,前者是A12,后者是A1),其型号为G11P,仍看到了一些非常明显的类似于去年A11 GPU的设计,各个功能块在很大程度上似乎位于相同的位置,并以类似的方式构造。

AnandTech认为,苹果在A12 GPU上最大的进步是现在支持了无损内存压缩技术。他们表示,当初在发布会上听到这个消息时,非常惊讶,因为这将意味着两件事:首先之前苹果SoC及GPU显然没有内存压缩技术,再者现在增加该技术支持本身就足以显著提升新GPU的性能。

内存压缩,主要是指从GPU到主内存的帧缓冲区压缩。在桌面领域,像Nvidia和AMD这样的显卡提供这一功能已有很多年了,即使在内存带宽没有增加的情况下,它也能提高GPU的性能。智能手机GPU同样需要内存压缩,这不只是因为移动SoC上的带宽有限,而更重要的是由于高带宽要求时可降低相关功耗。ARM的AFBC帧缓存压缩技术一直是移动领域公开的机制,而且高通和Imagination等其他厂商也有自己一套的压缩内存相关技术。

苹果只在A12上介绍了这一功能,看起来似乎太晚了,但意义却很重大。因为这意味着A12相比前一代能够在效率和性能上获得异于寻常的巨大提升。考虑到苹果在发布会上也表示新GPU性能提升显著,所以引入内存压缩技术此举意义重大。

A12 CPU内核频率

在过去的几代芯片中,苹果一直在稳步提高芯片大内核的频率,同时也提高微架构的IPC性能。AnandTech对A12和A11的频率特性做了快速测试,得出了下面对比的表格:

大内核方面,从A11到A12,实际上最大的提升就是拉高了最大频率,A11的Monsoon大核心为2380MHz,A12的新Vortex大核心则提高到2500MHz,不过在ST应用中这只是5%的频率提升。到第二大线程的频率,A11和A12的频率分别为2325和2380MHz。至于第三线程的测试,A11和A12的频率调度有所不同,A11已经下降到了2083MHz,A12则保持同样的2380,直到达到散热极限才最终减速。

小内核方面,相较于A11的Mistral内核,A12新的Tempest核心实际上更加保守。当A11只有一个小内核运行时,其最高频率可以达到1694MHz。而在新的A12芯片上,小内核最高频率限制为最高1587MHz。同时,当4个小内盒完全满载时,频率也进一步从1587MHz轻微降低到了1538MHz。

内存延迟大大改善

正如前述,苹果显然在A12缓存层次结构和储存器子系统中投入了大量的工作。通过AnandTech提供的线性延迟测试图,可以看到对于大核和小核的完全随机延迟改善明显,具体如下:

与A11的Monsoon大内核相比,A12的Vortex核心虽然只高了5%,但是L2内存延迟从11.5ns降到了到8.8ns,这是29%的提升。这意味着现在新Vortex核心的L2高速缓存可以在更少的周期内完成操作。在Tempest小核心方面,L2周期延迟似乎保持不变,但在L2分区和电源管理方面又发生了很大的变化,允许访问更大的L2物理块。

AnandTech只在64MB进行了测试深度测试,显然在这个数据集中,延迟曲线并没有变得平缓,但是可以看到DRAM的延迟已经有所改进。当小内核处于活动状态时,内存控制器DVFS的最大频率会提高,这可以解释为什么Tempest小内核的DRAM访问存在较大差异,而当大内核有大线程运行时性能会更好。

A12的系统缓存在其行为设计上发生了一些重大的变化。不可否认,带宽是缓存层次结构的一部分,虽然A12相比A11有所减少,但延迟却得到了很大改善。这里主要可以归因于L2预取器,或者系统缓存端的预取器,包括延迟性能和流预取器数量都已经增加。

指令吞吐量和延迟时间

为了比较Vortex大内核的后端特性,AnandTech测试了指令吞吐量。后端性能由执行单元的数量决定,延迟由设计质量决定。AnandTech表示,A12具有6个整数执行管道,其中2个是复杂的单元,还有2个加载/存储单元,2个分支端口和3个FP/矢量管道,这就等于是13个执行端口,远超过ARM即将推出的Cortex- A76,也比三星的M3也更宽。事实上,苹果的微架构在通道宽度方面似乎远远超过了其他任何阵营,包括桌面CPU。

A12 CPU性能:达到桌面级水平

关于CPU性能的测试,AnandTech选择的是编译的SPEC 2006这个软件。在他们来看,SPEC这个测试软件权威性更足,并称其为一个重要的行业标准化的CPU测试基准套件,这与一般测试CPU负载性能不同,所处理器的数据要大的多,也更复杂,重点测试系统的处理器,内存子系统和编译器等多个不同的基准测试。

AnandTech表示,虽然GeekBench 4已经成为当前非常受欢迎的行业基准软件,但他们希望可以有一个完整的跨平台的基准测试套件,而且不只是测试峰值性能。因此,SPE C2006被选为更具有代表性的高性能的跨硬件的基准测试软件,它能充分展示微体系结构的更多细节,特别是在内存子系统性能方面。

不过,AnandTech也指出,由于他们编译的SPEC 2006基准测试套件没有得到SPEC官方验证,因此接下来的测试的数据仅用于参考,而且性能测试是在可控的环境下进行的,并准备了帮助手机散热的风扇,目的是保证1到2小时内的热量不会影响测试。

关于测试之后制作的图表,AnandTech称右侧的数据越大表示SoC/CPU的性能越好,数字代表分数。而左侧轴上,表示给定工作负载的能耗使用情况,左边出来越长意味着需要更多的能耗,越短表示越节能,每瓦的平均功率指标相当重要,这里用到了瓦和焦耳作单位。而在数据对比方面,选择了之前做个测试的A11、高通骁龙845、骁龙835、三星Exynos 9810、Exynos 8895等。

第一个测试从SPECint 2006工作负载开始:

从上图可以看到,在大部分工作负载下,A12的时钟频率比A11高了5%。AnandTech称,考虑到无法真正锁定iOS设备上的频率,所以这只是基准测试期间运行时频率的假设而已,在SPECint 2006测试中,A12的平均表现比A11好约24%。

在456.hmmer和464.h264ref这两项测试中A12  芯片的提升最小。AnandTech表示,这两个是整个套件中瓶颈最多的测试项目,然而A12在这些方面似乎并没有什么大的提升,分数只有很小的涨幅,这主要还是得益于更高的频率以及缓存层次结构的改进。

在445.gobmk测试项A12的改进就相当大了,提升达到27%。AnandTech称他们测出A12在高速缓存行的存储处理方式上确实有一些重大变化,而在分支预测精度上没有显著变化。不过,在403.gcc、429.mcf、471.omnetpp、473.Astar和483.xalancbmk这几项对内存子系统性能测试方面,A12性能提升就非常大了,提升幅度从30%到42%不等。很明显,缓存层次结构和内存子系统的改进再次得到回报,AnandTech称这是最近几代性能飞跃最显著的一次。

说到 SPECint 2006测试中的能效方面,总的来说A12相比A11在能效上提升了12%,但这只是在最高性能下减少了12%的能耗,AnandTech表示若比较A11和A12两代芯片在性能/功耗曲线上的变化,的确体现出了平均24%的性能提升,但在性能提升幅度最大的测试项中(也就是前面有关内存工作负载的测试),A12的功耗其实是显著上升的,所以尽管7nm工艺本身能效更高,但A12依然比新工艺节点更耗电。在整个SPECint 2006测试期间,此前A11的平均功率为3.36W,而A12增加到了3.64W。

再看上面第二个SPECfp 2006测试图,AnandTech还进行了有很多内存密集型的测试。在SPECfp 2006测试中,A12相比A11的性能提升平均达到了28%。在433.milc测试项性能上获得了75%的显著提升。同样的情况还出现在450.soplex项目,AnandTech表示,A12出色的缓存层次结构和内存存储性能的组合使其性能大大提升了40%。

470.lbm这项测试充分展示了苹果A系芯片与ARM或三星内核相比有多方面性能优势,完全就是碾压级别,A12指令执行吞吐量的优势为性能做出了重要贡献。比较奇怪的是,高通以前的骁龙820芯片表现都还由于最近两年的SoC芯片。

而关于能效方面,AnandTech表示,A12在SPECfp 2006测试中的表现与上面的SPECint 2006类似,性能跃升同功耗也有所增加,其中433.milc测试项的功耗从A11的2.7W提高到了4.2W,这是75%的功耗增加。就SPECfp 2006测试整体功耗而言,A11是3.65W,A12增加到了4.27W。除了482.sphinx3测试项之外,上图中所有项目的功耗都有所增加,最大值达到5.35W。

测完SPECfp 2006和SPECint 2006,AnandTech放出了从A9到A12并包含最新Android阵营SoC芯片的综合性能横向对比,如下图:

AnandTech表示,就总体而言,新Vortex内核和SoC内存子系统的架构改进,使得苹果A12芯片比苹果营销所宣传的性能优势大得多,即便是与Android阵营最好的SoC相比,无论是性能上还是能效上的优势都非常明显。可以说,苹果SoC比所有Android阵营的SoC芯片都具有更高能效,并且还能提供近两倍的性能优势。如果将SoC所用的功耗统一标准化,那么苹果A12的表现将领先Android阵营SoC三倍,无需对此感到惊讶。

做完两项测试小结,AnandTech还谈到了竞争对手面对苹果A系芯片时的境况如何。例如说,三星Exynos 9810芯片能耗是去年苹果A11芯片的两倍,但性能差距仍达到了55%。有意思的是,AnandTech声称,虽然不清楚A12的性能与台式机CPU差距有多接近,但根据之前一些测试数据对比发现,A12在单线程性能方面已经优于某些英特尔中档Skylake CPU。

当然了,AnandTech也没有说得很绝对,他们称很多测试要考虑到测试工具在各平台编译问题,以及CPU的频率因素。但就当下的测试条件下,他们直言苹果的移动SoC在ST应用某些方面性能优于桌面CPU。

A12小核Tempest CPU测试

苹果公从A10芯片开始配备“能效”核心,也就是通常所说的小核心,从某种意义来说,这也是A系列芯片首次引入异构多核结构,这也验证了ARM最初的设计方向,也就是通过单独的低功耗物理内核有效地降低SoC的整体功耗。A12的小内核Tempest CPU已经是第三代了,依然是完全异构独立于大内核的设计。

AnandTech表示,A12的Tempest CPU架构与A6芯片的Swift微架构相似,苹果应该是基于此设计将其移植到64位系统,并将其当做低功耗的CPU核心。Tempest CPU的最高频率可以达到1587MHz,相比A11的Mistal小内核的1694MHz更低,所以在下面SPEC测试中,后者比前者快6.7%,造成这样的差距就是频率的问题。

从整个测试来看,其实A12的小内核性能与去年A11的非常相近,而得益于7纳米的工艺制程,在SPEC 2016测试的过程中,Tempest CPU能效相比Mistal CPU提升了35%。不过,AnandTech指出,其实7纳米工艺并不是提高Tempest CPU能效的关键,主要还是频率更低的原因,如果在同频的情况下可能功耗会更高,当前Tempest CPU与更高频的Mistal CPU的性能测试得分差不多,主要得益于内存缓存层次结构和内存子系统的改进。

在FP基准测试中,虽然A12的Tempest CPU比A11的Mistal CPU性能确实更优,但效率仅高出了17%。与自家的大核相比,小内核仅提供了三分之一到四分之一的性能,只不过功耗功耗使用不到还不到一半。其实将这A11和A12的小内核与其他基于ARM设计的芯片相比,也没有太多惊喜之处。

AnandTech称,最让人惊喜之处应该是在SPECint测试中,A12小内核的性能几乎与ARM两年前的高性能内核水平相当。更具体来说,在SPEC的整数测试中,Tempest CPU相当于2.1GHz主频的Cortex-A73内核。但在SPECfp测试中A12的小内核并不具优势,因为没有专门服务于浮点运算的资源,只是能效很高而已。

在这部分测试的最后,AnandTech表示苹果设计的CPU小内核性能比想象中好得多了,因为在ARM Cortex-A55上完成SPEC测试要花很长时间,根据不同的测试项目,两者的性能差异是2 - 3倍。AnandTech强调称,其实ARM的小内核性能在很多工作负载着性能已经不足,这就是为什么会有三丛集CPU架构的原因。就目前而言,小内核的最大性能与大内核的最低性能,都在朝着一个相同的方向发展,所以未来会怎样还未知。

A12神经网络引擎“理论”性能

新A12芯片最重要另一个改进就是神经网络引擎,苹果宣称这是内部自主设计的。正如在开头部分看到的,当前神经网络引擎在整个芯片中已经占据相当大一部分,其所占面积与两个Vortex CPU大内核接近。有意思的是,AnandTech没有太好的测试神经网络引擎的工具,所以目前只能选用国产测试工具鲁大师,只是因为其AI性能测试支持跨平台。

首先是Inception V3项目测试:

再者是ResNet34项目测试:

最后是VGG16项目测试:

总的来说,苹果官方所述的8倍性能提升在上述称成绩中并没有得到体现,分数显示的是4倍到6.5倍提升。这里有一个问题是,iPhone X的A11性能与iPhone 7的A10非常接近,主要是因为苹果在GPU上执行CoreML,也许是因为A11的NPU未开放API,所以测试工具无法真正执行测试。

华为麒麟970的AI人工智能性能落后A12大约2.5倍,预计本月中旬华为新发布的麒麟980芯片应该能够明显缩小与A12的差距。高通的骁龙845处理器表现也不差,基本上与华为麒麟970的水平相当。另外,鲁大师的AI性能测试使用的是SNPE框架进行理论加速,目前还不支持NNAPI,所以谷歌Pixel 2和三星Galaxy Note 9在测试中成绩差得可怕,因为只能回到CPU内核进行加速处理。

在AI性能测试的功耗方面,A12在测试过程中功耗达到5.5W。AnandTech称不清楚为何会有那么高的功率,这高过了之前性能测试的平均功耗,例如GPU的功耗在2.3W到5W之间。不过苹果愿意将功率提到5.5W,说明苹果愿意在AI性能上挑战极限,追求最高的突发性能。

综合系统性能

虽然综合性能测试比较重要,AnandTech称他们也希望很好地利用各种规范,但是iOS平台系统性能测试套件相比Android又少又糟糕,所以能做对比的也就网络浏览器测试。

首先是Speedometer 2.0测试,这是最新行业标准的JavaScript基准测试,可测试最常见和最新的JS框架性能。在Speedometer 2.0测试中,A12与A11相比性能大幅跃升了31%。对此AnandTech表示,苹果自己营销的性能数据其实远低于新芯片的实测数据。当然了,安装了iOS 12系统的设备相比之前也有小福提升,这不仅得益于iOS调度处理负载方式的改变,还得益于苹果所使用的JS引擎已进一步改进。

接着是WebXPRT 3测试,这也是一个浏览器测试工具,但工作负载情况更加广泛和多样化,包含了大量的处理测试。在WebXPRT 3这项测试中,iPhone XS比iPhone X强11%。同时,iOS 12系统也让老设备在性能上得到了提升,其中iPhone X的得分从134分上升到了147分,即10%的提升,iPhone 7也提升了33%。

iOS 12 CPU调度加载机制分析

苹果所指的iOS 12系统将让设备性能有显著提升,这主要归功于的新调度机制,充分考虑了各个任务的负载方式。AnandTech称,iOS系统的内核调度程序,通过跟踪线程的执行时间,并将其归纳为某种利用率指标或度量,然后交给DVFS机制来调度。决定负载如何计算或负载如何随时间变化的算法,通常只需一些简单的软件决策即可,苹果可以将其调整和设计到他们认为合适的方式。

由于iOS系统的内核是完全封闭的,所以很难剖析iOS 12与iOS 11相比究竟改变了什么,为此AnandTech采用实际测量的方式来查看调度机制的改变,其中相对简单的测量方法,就是跟踪负载从空闲到峰值性能的频率,特别是iOS 12系统升级前后的对比。下面开始从搭载A8芯片的iPhone 6一直测量到A12芯片iPhone XS。

首先从A8芯的iPhone 6开始,在iOS 11上测量出了很奇怪的结果,因为从空闲到满载性能的调度行为非常不寻常,重复了几次结果还是一样。A8 CPU空闲时为400MHz,并在此频率停留了110ms,接着跃至600MHz,然后经过10ms再次提升到1400MHz的峰值频率。不过,在iOS 12系统上调度行为呈现一种更为阶ti的形式,更早提前升频,并且在90ms后达到峰值性能。

iPhone 6S在iOS 11上的调度行为与iPhone 6明显不同,A9芯片的DVFS调度机制升频非常慢。CPU过了435ms才达到其最大频率。不过,随着iOS 12的更新,生频到峰值频率的时间已经被大幅削减到了80ms,大大提高了短时交互下的性能。

iPhone 7系的A10调度在iOS 11上与A9有相似的缺点,充分发挥峰值性能的时间需超过400ms。不过在iOS 12系统中,iPhone 7将这个时间减半,约为210ms。看起来A10与A9相比更为保守,但这可能与小内核有关。毕竟看图不难发现,Zephyr小核心频率最高峰值是1100MHz,而曲线图频率突然下降到758MHz,是因为此时小核心换到大核心,才会继续升频率,最后才是大核心的峰值性能。

在iPhone 8系和X的A11调度极致上,iOS 11与iOS 12没有太大的变化,两个版本系统A11都能在105ms的范围内升至全频。请注意,在A11之后,苹果A系芯片迅速升到峰值频率的时间比之前几代都要短得多了。

最后是iPhone XS系的A12芯片,必然无法测量更新前的变化,因为出厂预装iOS 12系统。不过可以看到,只需108ms的时间A12就能达到了峰值性能,从Tempest小核心转移到Vortex大核心的时间也极短。

AnandTech测完调度机制之后表示,iOS 12在旧款iPhone上的性能调度与iOS存在明显差异,至少测量就能非常直观地发现CPU升频曲线的变化。对于iPhone XS,日用性能上绝对没有任何问题,速度已足够快。AnandTech还提到,他们日常使用的是Android手机,而且会完全关闭动画效果,因为他们认为不关会影响设备的速度,或者或严重掩盖设备的真实性能。然而,虽然iOS没有办法完全关闭动画,但是iPhone XS依然能快速运行,毫无顾虑。

GPU性能测试

GPU的性能提升是A12的最大亮点之一,按照苹果的说法,相比A11的GPU性能提高了50%。AnandTech表示,苹果只是“简单”额外添加了1个GPU核心(A11有3个核心),并在GPU中引入无损内存压缩技术,就能实现了性能大提升。其中,内存压缩技术被AnandTech认为是现最助于提高GPU微架构性能的因素,声称引入内存压缩绝对是一次巨大的转变,但不可否认,苹果花了很长时间才实现这点。

在进行性能测试之前,AnandTech称他们最大的疑问是A12最新GPU的峰值性能和峰值功耗如何。因为之前苹果长期都会执行一些所谓“骚操作”,也就是在运行一段时间后,持续性能直接变为性能下降。

首先跑3DMark Sling 3.1物理测试,既考察CPU更强调GPU使用时的平台整体功耗极限。在这一测试中,A12相比A11有很大的进步,过去这项测试对苹果A系芯片都不太理想,但是A12整体能效提升,性能也得到了一定提高,因此终于可以匹敌ARM阵营了。

再者是 3DMark针对GPU图形性能的测试部分,iPhone XS相比去年的iPhone X的持续性能提升了41%。

GFXBench测试

最近Kishonti发布了最新GFXBench 5 Aztec Ruins测试工具,因此AnandTech将此测试套件作为选择,新套件针更现代、更新,测试更复杂,同时新增的Aztec场景测试提供了更加复杂的效果,更强调GPU的运算性能,包括填充率、纹理、着色器效果和带宽性能等。GFXBench 5测试子项大概如下:

普通模式下的Aztec Ruins场景是一个要求不那么高的新测试场景,所以苹果A12芯片充分展示了其极高的峰值性能。在Aztec Ruins场景普通模式中,A12相比去年的A11提升了51%。不过,就持续性能表现而言,峰值性能在几分钟后就迅速下降了,并逐步稳定下来,不过在持续性能方面,iPhone XS的性能相比iPhone X仍提升了61%。并且A12也能够在持续性能表现上以45%的优势击败Android阵营的旗舰芯片高通骁龙845。

高级模式下的Aztec Ruins场景要求就高得多,而且更复杂。不过,这份性能排名中A12的性能依然惊人,iPhone XS的峰值性能仍非常出色,而且持续性能的跑分也不低。在Aztec Ruins场景高级模式下,iPhone XS持续性能同样比iPhone X提升了61%,而领先骁龙845的性能差缩减到了31%,相比普通模式略低了一些,可能在某些方面碰到瓶颈,但依然最强。

在 Manhattan 3.1场景中,iPhone XS的GPU性能相比iPhone X提升巨大,达到75%。AnandTech表示,A12取得这样的成绩不仅是因为GPU微架构的改进,还要加上1个额外的核心,以及全新的工艺节点,但重点还要归功于新的内存压缩技术。

最后是T-Rex场景,A12再次展示了GPU性能的巨大提升。在T-Rex场景中,iPhone XS持续性能相比iPhone X提升了61%,并且傲视群雄。

GPU功耗

由于新的Aztec Ruins场景很多设备还有相关数据,所以这一次依然依赖于Manhattan 3.1场景和T-Rex场景测得的数据。A12的GPU由于引入了内存压缩技术,进一步降低了外部DRAM的功耗,相当于在高带宽3D图形负载下减少了20%-30%的功耗,而节省下来的功耗同样可以转换为更高的性能。

GFXBench Manhattan 3.1场景下测试的功耗,下面数字显示的是设备整机功耗减去空闲功耗(包括屏幕功耗),在设备保持22度以下的温度时,峰值状态下A12的GPU非常耗电,平均功率达到了近6W,不过这仍不是GPU最高功耗,前面3DMark测试中(崩溃前)曾经达到7.5W左右。

AnandTech表示,即便A12的GPU平均功耗不低,但其效率仍超过了所有SoC芯片,每瓦功率能够提供的帧率达到前所未有的水平。不过,苹果依然有所谓“骚操作”,仅3分钟或者进行三次测试之后,GPU性能就会因为节流降频下降25%。所以在下面的功耗表中,提供了“Warm”发热状态下的平均功耗,具体为3.79W,但可以看出其每瓦能够提供的性能仍然超过了所有SoC。

在T-Rex场景测得功耗数据与上面在Manhattan 3.1场景下看到的情况差不多,保持设备凉快也就是22度以下的温度时,A12的GPU峰值平均功率达到6W多一点。而在在运行3次之后,发热的设备再次将功率降低到4W以下。虽然性能也下降了28%,但每瓦性能依然出色。

测完功耗之后AnandTech表示,A12发热时的功耗并不是是持续性能时的功耗,大多数设备的在持续性能发挥时,功耗一般都控制在3W-3.5W的范围内。A12的GPU峰值性能和持续性能存在那么明显的差异,与苹果为GPU设计的日常应对的场景,以及苹果针对A12的3D图形处理如何调度GPU负载有关。

苹果针对A12的GPU设计了大量使用场景,例如在大多数应用中都会使用到GPU硬件加速进行相机图像处理,在这种用例中,GPU的持续性能并不重要,因为只是短暂的负载工作,很快就处理完毕。对于节流降频,AnandTech认为苹果需要做一些优化,毕竟在使用iPhone XS玩游戏过程中不会喜欢发热,应该通过某种必要的方式,来保证对持续性能有需求的游戏或应用也能充分利用更高的持续性能。

最后,AnandTech表示,其实除了发热不久后降频,以及无法持续太久峰值性能之外,苹果最新的A12的GPU依然展示了行业最领先的性能和能效,至少可以说iPhone XS和XS Max目前是全球最好的游戏移动设备。

续航水平

测完了A12,可能大家还想看看A12设备的电池续航水平,AnandTech也对此进行了测试。iPhone XS配备了2658 mAh/10.13Wh电池,iPhone XS MAX的容量则为3174 mAh/12.08Wh。可以看出,尽管这两款手机都是大尺寸形状的设备,但在同尺寸设备的竞争中,苹果为它门配备的电池容量仍落后于竞争对手。

不可否认,屏幕最大的iPhone XS Max配备的电池已经是iPhone有史以来容量最大的一块,但与其他手机厂商在同一规格下使用的3500 - 4000mAh相比,仍然相形见绌。正如前面在A12的SPEC测试中AnandTech所说的那样,苹果的SoC优势之一就是在能效方面遥遥领先,所以这很大程度上弥补了电池容量不足的缺口。

AnandTech测试续航的方面就是直接在WiFi下进行web网页浏览测试,不过设定的是一种从混合到繁重的负载测试,让设备浏览多遍他们在服务器上托管的一组网页。测试中,针对一个web页面会执行加载、暂停、滚动、暂停等操作,然后再继续到另一个网页,当完成一组页面测试后再重复所有操作,测试中屏幕亮度是固定在200 cd/m²。

在测试中,iPhone XS的续航时间与iPhone X相比略有下降,减少了19分钟。尽管这19分钟并不是天大的差距,但令人疑惑的问题还是来了:苹果无论在发布会上承诺iPhone XS续航相比iPhone X有所改善,尤其使用时间iPhone XS比iPhone X最长增加30分钟,可为何没有得到体现?不过,查看苹果官方页面上网页浏览续航,两者确实同为12小时,这里AnandTech的测试要复杂和严苛一些,所以续航缩减到了10小时内,只是20分钟的差距真的有点明显了。

iPhone XS Max的续航测试最后的结果是10小时3分钟。虽然这样的成绩不错了,但却比iPhone 8 Plus的11.83小时下降明显。当然了,这里的差异合理化会更容易解释一些,尽管AnandTech测试的网页是多样性的,很多暗色或深色页面,但不管怎样,XS Max采用的OLED屏幕在浏览白背景页面时必然更耗电,而且机子屏幕面积也比iPhone 8 Plus更大,所以增加的电池容量不足以抵消面板耗电的增加。

AnandTech比较纠结为什么iPhone XS相比iPhone X续航时间下降了20分钟。为了进一步证实,他们还给iPhone X升级了iOS 12重新测试,确保测试条件统一而不影响结果。有趣的是,升级iOS 12之后iPhone X得到的成绩比1月份测试时还少了10分钟,不过这10分钟的差异可以忽略不计,可以肯定iOS版本不是影响续航的主要因素。

AnandTech称他们在对A12测试时已经明确,该芯片在工作负载方面缺少更高效了,即使带来了更高的性能,这也应该是相对安全的耗电水平。不过,峰值和空闲之外各个阶段的性能耗电量无法知晓,也就无法验证是否是中等性能状态下功耗更大,毕竟中等性能也是CPU执行大量运算阶段。

另外,AnandTech还进行了另一种假设,认为非常有可能是连接性因素所致,虽然不清楚全新来自博通的Broadcom BCM4377 WiFi组合芯片能效如何,但关键是iPhone XS使用的不再是高通基带,反而是来自英特尔的XMM 7560基带,这可能是影响续航的关键因素之一。

为什么这么说呢?AnandTech解释称,几年前,由于移动运营商的基带基站没有启用CDRX,所以遇到了一些严重的配置错误问题,因此他们基本上放弃了LTE续航测试,毕竟这导致测试华为设备时续航下降了近20-30%。事实上,手机续航测试比想象中要困难得多,如果没有受控的环境,就不要轻易执行这项测试。

总的来说,iPhone XS和XS Max电池续航水平还是是不错的,只是并没有达到苹果所宣传的改进,但这其中涉及的不确定性太多了。

小结

最后在评测的小结阶段,AnandTech表示,苹果A12芯片是SoC中的怪兽。尽管A11已经在性能和能效方面击败了竞争对手,但A12在这方面却加倍努力,这要归功于苹果世界级的设计团队,他们能够从CPU微架构中挤出更多的提升空间。

A12 Vortex CPU的内存子系统获得了巨大的提升,这使得A12在很多工作负载下获得了显著的性能提升。苹果的营销部门实际上低估了CPU方面的改进,只报了15%提升。AnandTech估计,A12的CPU在很多负载测试下的性能会提高40%左右,在某些情况下甚至会有更大的提升。苹果的CPU现在已经有了非常高的性能,所以更期待未来几年的会如何发展,以及这对于苹果的非移动产品将意味着什么。

在GPU方面,苹果官宣的提升确实在承诺的数字之内,但在持续性能表现方面超过了承诺的数字。新GPU看似去年的迭代升级,但是添加了第四个核心,并新增了无损内存压缩技术,这一重要的改进将GPU性能提升到了新的水平。GPU方面AnandTech认为苹果真的要改进节流降频机制,不是完全不节流,而是应该更少节流,因为直接开放性能上限会非常耗电,并且在游戏的最初几分钟就会给手机带来很大的发热量。

在电池续航方面,iPhone XS在网页浏览测试中相比iPhone X并没有提升,在一定程度上令人惊讶。这不确定这是否与A12某种隐性的低能效有关,或者可能与新的WiFi芯片或蜂窝调制解调器有关。对于英特尔基带,AnandTech称他们将会花些时间讨论这个话题,并重新验证续航时间。

对于iPhone XS Max,电池续航时间低于iPhone 8 Plus其实不足为奇,毕竟OLED屏幕的能效低于去年iPhone配备的LCD显示屏,而电池容量的增加并不足以抵消这一点。对于那些认为iPhone XS Max大尺寸大电池续航就更好的用户而言,这是需要注意的地方。总之,综合来看,iPhone XS和XS Max是苹果迄今为止发布过的最好的手机。

, 1, 0, 13);