您的位置: 首頁(yè) >互聯(lián)網(wǎng) >

3DMark獲得全面的射線追蹤功能測(cè)試

2022-08-09 23:57:20 編輯:鳳葦芝 來源:
導(dǎo)讀 在最好的顯卡需要不只是在性能和價(jià)格上進(jìn)行競(jìng)爭(zhēng),而且對(duì)功能。既然RX 6900 XT,RX 6800 XT和RX 6800正在加入Nvidia,以通過硬件支持光...

在最好的顯卡需要不只是在性能和價(jià)格上進(jìn)行競(jìng)爭(zhēng),而且對(duì)功能。既然RX 6900 XT,RX 6800 XT和RX 6800正在加入Nvidia,以通過硬件支持光線追蹤,我們真的很想知道它們?cè)谛阅芊矫娴谋容^。誰(shuí)將在我們的GPU基準(zhǔn)測(cè)試體系中獲得最高榮譽(yù),如果在啟用光線跟蹤的情況下進(jìn)行測(cè)試,情況將如何改變?

多年來,游戲中的射線追蹤一直備受關(guān)注。我記得在2008年《雷神之錘4敵人領(lǐng)土》(Quake 4 Enemy Territory)擁有原型射線追蹤模塊時(shí)。它看上去很酷,但是性能卻很差。在16核CPU上以16 fps 720p播放?但是至少這是什么!

快閃十年了,英偉達(dá)的RTX硬件承諾了出色的質(zhì)量和性能。除了RTX卡以外,游戲仍然使用混合渲染方法,其中大多數(shù)渲染是使用傳統(tǒng)方法完成的,光線跟蹤僅在事實(shí)發(fā)生之后才應(yīng)用,以實(shí)現(xiàn)一些特定的效果,例如反射或陰影。

使用當(dāng)今支持光線跟蹤計(jì)算的現(xiàn)代GPU,在游戲上進(jìn)行全路徑跟蹤需要做什么?Quake II RTX和Minecraft RTX已經(jīng)做到了這一點(diǎn),但是它們是較老的且不太復(fù)雜的游戲,具有路徑跟蹤功能。現(xiàn)在,UL為3DMark添加了一項(xiàng)功能測(cè)試,該測(cè)試對(duì)皇家港口基準(zhǔn)進(jìn)行了資產(chǎn)的全光線跟蹤渲染。(請(qǐng)注意,您將需要Advanced或Pro版本來訪問DirectX光線跟蹤功能測(cè)試,如其所稱。)

我們喜歡能夠在各種GPU上比較“純”光線跟蹤性能的想法。3DMark DXR功能測(cè)試現(xiàn)在為我們提供了另一種方法,盡管它沒有報(bào)告每秒射線/三角形相交的數(shù)量(這是我們真正想要看到的),但它確實(shí)提供了與光線跟蹤硬件直接相關(guān)。我們將當(dāng)前的RTX GPU進(jìn)行了匯總,以供參考。更重要的是要看到AMD即將面世的Big Navi,RX 6900 XT,RX 6800 XT和RX 6800都將在下個(gè)月左右推出。

我們通過DXR功能測(cè)試運(yùn)行了所有RTX卡,但RTX 2070和2080除外(它們應(yīng)該落在新的Super變體之間的中間位置)。的的GeForce 3090 RTX是在4X的性能RTX 2060時(shí),RTX 2080鈦的兩倍以上的速度是2060位,和的GeForce 3070 RTX是略快于2080鈦。RTX 3090也比GeForce RTX 3080快19%,這比我們測(cè)試過的大多數(shù)游戲都要大?;旧?,這里的事情更多地受到GPU的限制,因此理論性能最終接近現(xiàn)實(shí)。

多近?我們使用RT內(nèi)核的數(shù)量,GPU時(shí)鐘和RT內(nèi)核的生成來計(jì)算一些數(shù)字。Nvidia表示,第二代30系列RT內(nèi)核比第一代20系列RT內(nèi)核快約70%。例如,這意味著3070應(yīng)該比2080 Ti FE快約7%,而2080 Ti應(yīng)該比RTX 2060快150%。

30系列GPU的擴(kuò)展幾乎完全符合預(yù)期。3070確實(shí)比2080 Ti快了7%,3080比3070快了48%(預(yù)期為47%),而3090比3080快了19%(相比預(yù)期為19.5%)。

但是,在20系列零件上的結(jié)果最終變化更大。2060超級(jí)版比2060快14%(預(yù)期為11%)。但是,2070 Super僅比2060(理論上的41%)快35%,2080 Super快65%(理論上73%),而2080 Ti快127%(上理論上150%)。盡管如此,這幾乎足夠接近受人尊敬的行為和良好的起點(diǎn)。

我們也想在某些非RTX GPU上運(yùn)行DXR功能測(cè)試,但它基本上是在嘲笑我們并嘲笑我們的硬件。“您微不足道的GTX 1660 Super和GTX 1080 Ti無(wú)法處理光線追蹤的真相!” 實(shí)際上,它告訴我們我們的硬件不支持運(yùn)行測(cè)試所需的DXR Tier 1.1功能集。對(duì)于GTX上的DXR,通過驅(qū)動(dòng)程序和著色器hack來說是如此:光線跟蹤硬件加速是必需的。

更大的問題:AMD的RX 6800,RX 6800 XT和RX 6900 XT相對(duì)于RTX 3070,RTX 3080和RTX 3090的價(jià)格如何?根據(jù)理論估算,6900 XT可能會(huì)降落在3070和3080之間的中間位置,而6800 XT會(huì)比3070快一點(diǎn),而RX 6800則位于2080 Ti和2080 Super之間。但是理論上的性能估算可能與實(shí)際情況不符,我們絕對(duì)有興趣在本月晚些時(shí)候看到情況如何。

關(guān)于3DMark DXR功能測(cè)試,還有很多要討論的內(nèi)容。例如,它的運(yùn)行方式與我們預(yù)期的不太一樣。默認(rèn)設(shè)置以1440p的像素每像素12個(gè)隨機(jī)樣本進(jìn)行渲染,并且像大多數(shù)路徑跟蹤算法一樣,這些樣本的輸入被組合起來以給出最終的像素顏色結(jié)果。然后再次采樣,結(jié)果質(zhì)量得到提高。通常,將重復(fù)此過程,直到達(dá)到所需的質(zhì)量水平。

問題在于3DMark DXR Feature Test實(shí)時(shí)進(jìn)行所有采樣和累加。樣本計(jì)數(shù)指定累積速率,并在物體運(yùn)動(dòng)時(shí)直接影響圖像質(zhì)量。但是,一旦相機(jī)停止移動(dòng),您最終將獲得每個(gè)場(chǎng)景相似的最大質(zhì)量結(jié)果(經(jīng)過相同的總時(shí)間)。

使用2采樣設(shè)置時(shí),相機(jī)開始移動(dòng)時(shí),與默認(rèn)的12采樣設(shè)置相比,物體看起來有點(diǎn)顆粒感,而默認(rèn)設(shè)置為12采樣設(shè)置。但是,一旦相機(jī)暫停幾秒鐘,屏幕上的結(jié)果就會(huì)開始迅速收斂。查看這些圖像質(zhì)量比較。

同一場(chǎng)景的上述畫廊展覽圖片右后攝像機(jī)暫停,直到只是之前它再次開始轉(zhuǎn)動(dòng)。因此,前三個(gè)“開始”圖像是“最差”質(zhì)量,而三個(gè)“結(jié)束”圖像是“最佳”質(zhì)量。請(qǐng)注意,屏幕抓圖來自使用ShadowPlay進(jìn)行的視頻捕獲,因此您應(yīng)該忽略一些壓縮偽像。這是為了使每種設(shè)置的捕獲相同幀變得更加容易。(這些結(jié)果來自RTX 2080 Ti。)

視頻壓縮偽影會(huì)掩蓋您在場(chǎng)景運(yùn)動(dòng)時(shí)會(huì)看到的許多其他噪聲,尤其是在2采樣設(shè)置上。但是,即使在穩(wěn)定圖像的時(shí)間很短的情況下,也要檢查圖像看起來有多相似。三個(gè)“最終”結(jié)果基本相同,唯一的區(qū)別是隨機(jī)采樣的播放方式。但是,到目前為止,最大的因素是性能。

使用RTX 2080 Ti,默認(rèn)12個(gè)樣本的平均性能為30.2 fps。每個(gè)像素下降到兩個(gè)樣本,性能將躍升至165 fps,而將采樣數(shù)增加到每個(gè)像素20個(gè)樣本,則性能將僅下降至18.1 fps。換句話說,每幀每像素的采樣數(shù)幾乎直接影響性能。

我想看到的是一種在各種樣本計(jì)數(shù)之上運(yùn)行的深度學(xué)習(xí)衍生降噪算法。當(dāng)然,默認(rèn)情況下2樣本圖像質(zhì)量非常嘈雜,但是Quake II RTX也是如此。請(qǐng)看以下示例:

“嘈雜”圖像的運(yùn)行速度提高了15%至25%,但是如果您實(shí)際上是想制作一款可玩的游戲,它的作用會(huì)更大。然后的目標(biāo)是做足夠的樣本以獲得可以轉(zhuǎn)換為更好看效果的圖像。想想DLSS,但除了上調(diào)幅度外,它還可以消除噪聲并以一致的方式在各個(gè)像素之間進(jìn)行插值。

獲得接近完美的路徑跟蹤結(jié)果所需的每個(gè)像素的隨機(jī)樣本數(shù)通常為數(shù)百。對(duì)于實(shí)時(shí)游戲應(yīng)用而言,這不會(huì)很快發(fā)生。但是,Quake II RTX允許您調(diào)整用于照片模式的樣本數(shù)量,范圍從100到8000。

最多需要一分鐘的時(shí)間來渲染1080p的單個(gè)幀,而100個(gè)樣本可以很快完成。同時(shí),圖像質(zhì)量在基線100個(gè)樣本以上不會(huì)有太大變化,但是如果您要渲染比Quake II更復(fù)雜的游戲可能會(huì)更重要。

選擇更多的樣本,更低的性能和更高的圖像質(zhì)量;或更少的樣本,更好的性能和更低的圖像質(zhì)量。在游戲中,要想在質(zhì)量和性能之間找到一個(gè)良好的平衡,就需要利用更高質(zhì)量的光線跟蹤渲染技術(shù)。在照片模式之外,Quake II RTX每個(gè)像素僅使用幾個(gè)樣本,并且可以輕松達(dá)到RTX顯卡上的可玩性能。

當(dāng)然,還有幾個(gè)問題。首先,為了進(jìn)行去噪,它是否需要Nvidia的Tensor內(nèi)核,還是可以通過FP16在常規(guī)GPU著色器上完成(使其與AMD GPU兼容)?它將對(duì)性能產(chǎn)生多大影響?

更重要的是,完全光線追蹤的游戲或圖形是否重要的??問題。當(dāng)前的光線追蹤游戲通常使用混合渲染方法,光柵化處理大多數(shù)底層圖形,并且光線追蹤效果僅用于反射,陰影或全局照明之類的事物。但是,如果混合渲染可以在以更快的速度運(yùn)行時(shí)獲得相同的視覺效果,那不是最佳的整體效果嗎?

一個(gè)問題是,混合渲染需要用于傳統(tǒng)柵格化的所有代碼以及用于光線跟蹤的代碼,這意味著游戲開發(fā)人員可能需要做更多的工作。再說一次,由于虛幻引擎和Unity中內(nèi)置了對(duì)光線跟蹤的支持,這比您可能遇到的問題要少。無(wú)論如何,我們不太可能在不久的將來放棄柵格化。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。