从小米 11 到骁龙 888,2021 年旗舰手机体验探究( 二 )


GPU 方面 , 高通 Adreno 系列在安卓阵营独孤求败了很多年 , 在骁龙 888 上又带来了高通 GPU 史上最大的性能提升 。 840MHz 的 Adreno 660 , 性能提升 35% , 能效比提升 20% , 且性能和能效比的提升能同时实现 。
从小米 11 到骁龙 888,2021 年旗舰手机体验探究文章插图
同样使用小米 11(骁龙 888)和小米 10 Ultra(骁龙 865)对比参考 , 低压力场景的提升在 27% 到 35% 左右 , 提升最大的是 3D Mark 的 Wild Life 大压力测试 , 幅度达到 53% , Vulkan 模式下的 GFXBench Aztec 场景也有 43% 的提升 。
而骁龙 865 的 Adreno 650 , 就算超频到 905MHz , GFX 曼哈顿场景也 " 只有 "110fps(默频骁龙 865 是 90fps) 。 但骁龙 888 的 Adreno 660 , 在 840MHz 就已经有 118fps , 部分用户都跑到 125fps 以上了 。 骁龙 888 GPU 的同频性能 , 依然比超频到 905MHz Adreno 650 高 15% 以上 。
性能之外 , 骁龙 888 还有隐藏技能 。 Adreno 660 是首个在移动端引入可变速率阴影(VRS)技术的 GPU 。 VRS 是桌面平台刚上的新增特性 , 能在 VR/XR 等场景中 , 降低非注视区域的着色精度 , 大大降低 GPU 的压力 。 在 VR/AR 还在构建发展的阶段 , 看到高通积极地提供相关特性 , 无论是游戏厂商还是用户 , 大家都是非常欢迎的 。
2
第六代 AI 引擎:60% 的算力提升
和其他芯片厂商不同 , 在 CPU、GPU 和调制解调器之外 , 高通每年都会 " 花很多笔墨 " 聊 Hexagon DSP 。 而高通的 AI 构架 , 也是各个厂商中最特殊的 。 从 AI 部分的提升 , 能看到高通在方向和策略上的考量 , 以及未来一年移动 AI 的发展趋势 。
遥想 2017 年 , 主流旗舰只有 0.6TFOPS 的 AI 算力 , 独立的 NPU 也才 2TFOPS 不到 。 但后来从骁龙 855 的 7TOPS , 到骁龙 865 的 15TOPS , 再到骁龙 888 的 26FTOPS , 移动端对 AI 算力的渴求依然见不到尽头 。
和常见的独立 NPU 不同 , 高通是 CPU+GPU+DSP 等多部件的异构 AI , 宣称可以比独立的 DSP+ 机器学习推理引擎方案 , 提供更高的性能和灵活性 。 而当中的 Hexagon 780 , 其实是骁龙 888 上提升最大的部分 。
从小米 11 到骁龙 888,2021 年旗舰手机体验探究文章插图
以前 Hexagon 600 系列中的标量 , 张量(Hexagon Tensor Accelerator , HTA)和向量(Hexagon Vector eXtensions , HVX)功能 , 在 Hexagon 780 被融合在一起 , 成为一个整体式 IP 。
融合后 , 不同执行引擎间的工作负载切换时间也更短 , 性能和能效都提升巨大 , 标量执行能力提高了 50% , 张量执行吞吐量直接翻倍翻 。 SRAM 增加 16 倍后 , 狂涨的内存池 , 能运行更大的机器学习推理模型 。
几乎推倒重构的构架 , 配合 X1 超大核 2 倍的机器学习性能和暴涨的浮点性能、AI 性能提升 43%的 Adreno 660 , 每瓦性能提升 3 倍的 Hexagon 780 , 让骁龙 888 可以提供远高于前代的 26 TOPS 算力 。
从小米 11 到骁龙 888,2021 年旗舰手机体验探究文章插图
骁龙 888 官方测试成绩
在机器学习基准测试 MLPerf 中 , 骁龙 888 的性能最高提升 4 倍 , 远超 IP 块在执行单元的理论计算吞吐量改进(新内存体系的优势?)
夸张的 AI 性能 , 有什么用呢?高通技术公司产品管理副总裁 Ziad Asghar 提到 , AI 性能大幅提升的主要来自客户的需求 。 现在移动 AI 一大部分应用场景都是图像处理 , 是近年来手机拍照水平突飞猛进的重要原因之一 。
从小米 11 到骁龙 888,2021 年旗舰手机体验探究文章插图