一款全新的DX12 GPU基准测试已正式推出,就连RTX 5090这类顶级显卡在它面前都显得力不从心,性能表现被大幅压制。
Radiance DX12 GPU基准测试利用光线步进(raymarching),完全依赖FP32计算能力,旨在展示当前及未来显卡的潜力。
Radiance是前Tom’s Hardware和Thresh’s FiringSquad撰稿人AlanDong所编写的。这款基准测试依托DX12 API,借助运行一个运用光线步进技术打造的《打砖块》版本,以此来剖析现代GPU的FP32计算性能。
有意思的是,Alan一开始仅仅是把Radiance当作一个周末项目来做,后来才慢慢把它打磨成了一个完整的GPU基准测试工具。这个测试完全依靠光线步进几何:没有纹理贴图,没有取巧的捷径,也没有预烘焙的光照效果,所有内容都建立在纯粹的数学计算基础之上。
Radiance体积十分小巧,压缩后仅80KB,还配备了两个预设选项。其中第一个预设名为“RTX5090”,分辨率设定为720p,包含80个碎片;而Extreme极限预设的运行分辨率为1080p,碎片数量更是达到了640个之多。默认预设的总大小大约是5KB,Extreme预设则约为32KB,这也就意味着,即便处于最高负载状态,它也能毫无压力地完整存入现代GPU的L1缓存里。
Radiance最突出的优势在于,它测试的是GPU的FP32计算吞吐量和执行效率,而非显存带宽,或是光追、AI加速这类“附加功能”。不过,最核心的部分还是它所采用的渲染技术——光线步进(raymarching)。
光线步进主要用于物理模拟,是光线追踪的一种替代方案。以下是传统光栅化与光线步进的区别:
传统光栅化
顶点着色器变换坐标
光栅化阶段确定像素覆盖
像素着色器应用纹理与光照
输出合并到帧缓冲
光线步进(本基准测试)
计算着色器为每个像素派发1个线程
每个线程通过场景SDF进行光线步进
命中后追踪阴影光线并计算光照
直接写入UAV纹理
Alan还编写了一份更为详尽、深入的指南,里面具体阐述了Radiance的应用场景、其测试GPU计算资源的方式,以及人们对测试结果可以抱有的预期,有兴趣的读者不妨去阅读一下原文。
接下来,我们先从RTX 5090的测试数据展开说明。在默认的720p预设条件下,该显卡的测试得分为2085分,对应的平均帧率达到76.2FPS,平均碎片数量则是58.3。
在Extreme极限预设条件下,分辨率虽“仅”为1080p,不过碎片上限达到了640个,光线步进次数为72步,RTX 5090测试平台的运行帧率仅能维持在2–3FPS,平均碎片规模是123.1。而在碎片尚未大量生成的时候,平均FPS大约为41.8。
因为这个基准测试对GPU计算能力的占用率非常高,所以开发者专门添加了安全提示:在进行这项测试之前,请务必保证显卡拥有有效的散热措施,并且检查12VHPWR这类供电线缆的散热情况和连接状态都处于正常无误的状态。