AMD Ryzen Z1 (7540U/Phoenix2) 简单测试

名字少一个 Extreme,到底少了什么?

2023年11月更新:由于AMD更改了命名规则,本文中所有7540U实际均为7545U。

2023年发售的Ryzen Z1或者说Ryzen 5 7540U虽然表面上不起眼,但它其实是非常不同寻常的一个SoC:

  • AMD打破Zen2以来的传统,少见的专为Ryzen 5 SKU设计了Phoenix2 SoC,而非使用高端SoC屏蔽而来。
    这意味着7540U价格会与7840U/7640U型号拉开实质性差距,而非像前几代那样Ryzen 5几乎没有差价。
  • Phoenix2首次在移动端引入Zen4 dense核心,采用 2+4 的classic-dense混合设计。
    与异构大小核不同的是,Zen4 classic/dense核心在微架构层面完全等价,仅有后端物理设计方面的差异导致dense核心的密度更高、电压/频率上限更低。
  • GPU部分在Shader Array数量减半的同时进一步缩减一个WGP,比例与Phoenix有区别,更加的“头重脚轻”。

因此,早在年初我就表达了对Phoenix2这个SoC的兴趣。幸运的是,最近我确实有机会玩到了这个SoC,并且做了一些简单的测试可以分享。


测试平台

测试使用搭载Ryzen Z1处理器的掌机平台完成,测试了15W和30W两种功耗配置下的表现。对照平台是搭载Ryzen 7 7840U的HP Elitebook 835 G10笔记本(也就是战X 13),SPL为25W。由于HP并未提供修改功耗的选项,本文并未能对比同为15W/30W功耗下两个SoC的表现,测试结论仅供有限的参考。

Ryzen Z1 掌机 (15W) Ryzen Z1 掌机 (30W) HP Elitebook 835 G10
SoC AMD Ryzen Z1 AMD Ryzen Z1 AMD Ryzen 7 7840U
CPU核心 2 * Zen 4 @ 4.9 GHz
4 * Zen 4 @ 3.5 GHz
2 * Zen 4 @ 4.9 GHz
4 * Zen 4 @ 3.5 GHz
8 * Zen 4 @ 5.1 GHz
GPU核心 1SA 2WGP @ 2.8 GHz 1SA 2WGP @ 2.8 GHz 2SA 6WGP @ 2.7 GHz
AIE核心 战不了未来 战不了未来 战未来
UCLK 935 MHz 935 MHz 800 MHz
内存 16GB LPDDR5X-7500 16GB LPDDR5X-7500 32GB LPDDR5-6400
功耗设定 fPPT/sPPT/SPL均手动锁定为15W SPL=30W 默认 (SPL=25W)
AGESA版本 1.0.0.2 1.0.0.2 1.0.0.1f
GPU驱动版本 OEM OEM OEM

hwinfo识别信息

可以看到hwinfo将处理器正确识别为PHX2-A0,代号Phoenix2,与一般的7840U也就是PHX-A1/Phoenix不同。Z1处理器拥有6个核心、12个线程,每个核心均配备相同的缓存结构,三级缓存共16MB。

可以注意到,尽管采用Zen4 classic与dense两种不同的CPU核心,这颗处理器的指令集支持与7840U完全一致,而不像其它大小核平台那样可能存在AVX512指令集缺失等问题。

Zen 4正式发售已经一年左右,虽然Phoenix APU经历多次延期,不过时至今日也已经被各家媒体测试的非常全面了。因此本文主要关注Phoenix2相比常规Phoenix不同的部分,以及Phoenix2在不同功耗设定下的表现。

注意:本次测试使用pre-production的硬件、固件和GPU驱动版本,因此与零售硬件可能有少许不同。

CPU性能

对于CPU核心的性能,本文主要关注其在不同功耗下的性能差异,以及相对7840U(也就是Z1 Extreme)的表现。

SPEC CPU 2017 单线程

照例在Debian Linux / GCC 12.x环境下完成SPEC CPU 2017的单线程测试。

默频测试

定频3.2GHz测试

可以看出,绝对性能方面,Zen4 classic核心相比dense核心要高出30%左右,定频3.2GHz测试则性能完全相同。这一点验证了前文关于两者在微架构层面完全等价的说法。

除此之外,可以看出虽然7840U有更高的单线程标定频率,但是实际测试下来默频性能相比Z1并无优势。

7840U监控数据

观察7840U的运行数据,由于过高的电压与单线程功耗,其在跑分过程中并不能稳定在标定的5.1GHz频率,而是在4.8-5.1GHz之间波动,平均频率仅为4.96GHz左右。作为对比,Z1能在大多数情况下维持4.9GHz的单核频率。这方面的差异可能是由于芯片体质、固件版本、主板供电设计、电压回报机制、散热等差异共同导致,在后续的能效测试里会进一步体现。

Cinebench 多线程

使用Cinebench简单快速测试多线程性能,Z1在30W功耗下得分大约在10000分左右。25W的7840U性能高出18%,而同为30W同功耗的7840U还要略强一些(8%-10%),不过由于测试条件所限暂时没有数据可以展示。

将Z1限制到15W,相比30W会损失23%的Cinebench性能。参考其他人测试的能效曲线,在15W的低功耗下7840U的性能优势会略微降低。

CPU能效

由于Z1采用了两种不同的CPU核心设计,因此本文对能效的讨论也主要围绕单核心的能效展开。

V/F曲线

观察两种不同的Zen 4核心各自的VID表,可以发现在大多数情况下dense核心的电压都要更高。Classic核心在2.3GHz左右达到Vmin,dense核心则要到1.5GHz以下才达到Vmin。二者在1.5 GHz左右V/F曲线发生重合。

SPEC CPU 2017 能效曲线

需要注意的是,由于本文测试的两个SoC采用了不同的内存类型、uncore频率、主板设计和PhoenixPI版本,低功耗方面的调校也有所区别,不同SoC的数据并不适合直接比较。

具体到功耗,可以看出dense核心在2GHz以下的能效有一定的优势,2GHz以上则是classic核心更胜一筹。只不过在package基础功耗较高的背景下,这个优势并不明显。与电压VID表对照可以得知,在1.5-2GHz这一频率范围内,dense核心即便在电压稍高时也能获得更好的功耗表现,说明classic核心在同样的电压和负载下电流更大,某种程度上体现Zen4 classic为了冲击>5GHz的高频付出的代价。

从PPA的角度来看,dense核心使用classic核心62%的功耗、50%左右的含L1核心面积实现了77%左右的性能,在不需要极致每核心性能的场景可以说相当划算。但是与同核心数的纯classic核心处理器相比,高功耗下能效有非常明显的差距,仅有一定的面积优势,这一点与Intel的Gracemont、ARM的A710/A715较为类似。

除此之外,Z1在这项测试里相比7840U表现出了明显的高频能效优势,单线程运行于4.9GHz仅需要平均12.7W package功耗,运行于4.8GHz则降低到10W以内。相比之下7840U在同样频率下的功耗要高出不少。由于样本数量太少,暂不确定是普遍现象还是HP的Phoenix独有的问题。而本次测试使用的Z1平台的uncore电源管理依然不够完善,因此基础功耗较高,在低功耗下的表现不如7840U。


GPU测试

几个月前AMD宣布Z1与Z1 Extreme的参数时,Z1便引起了不小的争议,主要围绕Z1相比Z1 Extreme的核心规模缩减与设备差价通常完全不成比例。例如华硕官宣的Z1/Z1 Extreme型号的差价仅100美元(不到17%),但Z1 Extreme的WGP数量是Z1的3倍。

当然了,GPU的规模通常并不与3D图形性能成等比例关系,因此本文主要测试7840U这3倍的WGP核心数量在适合掌机的功耗下能产生多大的性能优势。

GPGPU测试

使用clpeak简单测试两个APU的FP32吞吐与内存带宽

由于25W功耗限制,7840U的GPU运行非常简单的FP32吞吐测试也无法完全发挥6WGP的实力,3倍WGP数量仅带来了2.3倍的FP32性能。而在实际游戏中,由于CPU会消耗更多的功耗,再考虑到内存带宽的限制,这一性能差距会大大缩小。

搭载LPDDR5X-7500的Z1可以使用clpeak跑出106.49 GB/s的内存带宽,而搭载LPDDR5-6400的7840U则只能跑出82.91 GB/s。

3D图形与游戏测试

分别运行3DMark Wild Life、Time Spy、Fire Strike图形测试

不难看出,在各项3DMark图形测试里,Z1处理器与完整规格7840U的差距巨大。25W的7840U相较15W的Z1普遍可以高出80%左右,差距最小的Fire Strike也可以达到70%左右。

不过Z1在两种TDP设定下的差距低到可以忽略不计,仅在Time Spy测试中拉开9%左右的差距。观察功耗监控可以发现,尽管SPL功耗墙设定为30W,Z1仅需22W左右即可在Time Spy测试里让GPU跑满2.8GHz的频率。SPL限制为15W时,GPU可以运行在1.8-2.0GHz左右,但即便有如此巨大的频率差异,在各项跑分里两种功耗下的性能差距依然非常小。这一测试也符合之前在其它测试中观察到的现象:Phoenix、Navi33在2GHz以上的性能提升几乎忽略不计。

来到游戏测试的环节,本文选取了几个比较有代表性的场景:米哈游旗下两个热门的基于Direct3D 11的Unity游戏(均解锁帧数)和3个传统的3A游戏,均运行于720p。

可以看出,这两颗SoC在两个Unity游戏里的性能差距并没有想象中那么大。其中《星穹铁道》星槎海中枢跑图的CPU负载较高,GPU负载相对较低,三次测试的差距均比较小;而《原神》阿如村则是GPU负载最高的一类场景,25W 7840U比30W Z1的性能高出28.6%,Z1在30W下则比15W性能高出34%。

在GPU负载更高的3A游戏里,高GPU规格带来的性能差距更加明显。在测试的三个游戏里,7840U相比30W的Z1分别领先37.2%,57%和24.6%。但在这些游戏里,30W的Z1相比15W则几乎没有提升,分别高出19%,15.6%和15%。

可以看出,由于整体规模的不足,Z1更适合用在15W甚至更低功耗的场景下,并且更适合玩一些相对轻量的游戏。而7840U在25W下依然明显是处于喂不饱的状态,与Z1的游戏性能差距远远小于规格差距,也小于GPU跑分的差距。Phoenix2更适合掌机和超轻薄型笔记本,而完整的Phoenix则更适合1.2-1.4kg左右、满性能释放的全能型标压笔记本。

FSR2测试

对于掌机而言,FSR2是绕不开的话题。正如上面的游戏测试,哪怕是性能最强的7840U,许多3A游戏在720p低画质下依然难以实现原生分辨率60fps运行。因此合理利用各类upscaling技术可以极大地提升体验。

本文也照例测试了FSR2 Vulkan demo在掌机常用的几个分辨率下运行的性能开销。

可以看出,Z1在720p质量档下的FSR2开销大致相当于7840U运行1080p性能档,而在1080p下Z1的开销则显得过大。因此在使用FSR2时,7840U适合输出720p 120fps、1080p 60fps、1440p 30fps的画面,而Z1输出720p 60fps、1080p 30fps的画面比较合理。搭配更高分辨率、刷新率的屏幕则会因为开销过大而导致FSR2本身占用太多GPU时间,使得帧数难以接近目标。


总结

Phoenix2首次将dense核心引入消费级产品,让我们有了低成本了解这个新核心类别的机会。在当前的产品里,classic+dense的混合CPU还带有一点实验性质,并且产品SKU藏得很深、很不起眼。随着Intel进一步提升小核性能,AMD未来几代移动端产品里的dense核心也必然会变得更加重要。初代dense核心的表现尚可,让人期待Zen5的dense核心为消费者带来更大的提升。

而对于GPU而言,事实证明,低功耗处理器的GPU规模并非越大越好。通过本文的测试,我们很容易看出7840U的6WGP GPU在掌机这个级别的功耗下的性能优势已经明显出现消退。同时,Z1/Phoenix2这个处理器的表现也整体强于我的预期:在实际使用基于这个SoC的掌机产品的这段时间里,我很少遇到15W下完全跑不到30fps的游戏。尤其是对于《原神》、《星穹铁道》这类比较适合掌机的游戏,在合理设置分辨率和画质的前提下体验相当优秀,15W的功耗设定也保证了足够长的续航和极低的风扇噪音。

即便如此,当前类似ROG Ally的掌机在Z1与Z1 Extreme版本之间仅有100美元的差价,我依然认为差价过小。但如果未来这类基于小规模APU的产品可以换用原生800p/720p 60Hz屏幕,同时进一步缩减供电、散热水平以减轻重量、降低成本,那么有足够的潜力与高阶的Extreme版本形成差异化的竞争。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注