近期,顯卡市場(chǎng)迎來了一波新的關(guān)注,焦點(diǎn)集中在NVIDIA最新推出的RTX 50系列上。然而,令人驚訝的是,這款備受期待的產(chǎn)品在一些性能測(cè)試中的表現(xiàn)并未超越其前任RTX 40系列,特別是RTX 5090未能擊敗RTX 4090的成績(jī),引發(fā)了廣泛討論。
經(jīng)過深入分析,問題背后的原因逐漸清晰。NVIDIA在RTX 50系列中采用了全新的“Blackwell”架構(gòu),并做出了一個(gè)關(guān)鍵決策:不再支持32位的OpenCL和CUDA。這一變動(dòng)導(dǎo)致RTX 50系列顯卡與部分現(xiàn)有的測(cè)試工具和應(yīng)用程序之間存在不兼容的問題,進(jìn)而影響了性能測(cè)試的準(zhǔn)確性。
具體而言,當(dāng)RTX 50系列顯卡運(yùn)行某些基于DirectCompute的基準(zhǔn)測(cè)試時(shí),會(huì)返回資源不足的錯(cuò)誤代碼。開發(fā)人員發(fā)現(xiàn),盡管這些測(cè)試的主要應(yīng)用程序已經(jīng)遷移到64位,但其中的部分計(jì)算子測(cè)試仍包含32位代碼。這些32位代碼在RTX 4000系列及更早的顯卡上能夠正常執(zhí)行,但在RTX 50系列上卻無(wú)法運(yùn)行。當(dāng)遇到32位CUDA應(yīng)用程序時(shí),RTX 50系列顯卡不得不依賴CPU進(jìn)行處理,導(dǎo)致性能大幅下降。
為了應(yīng)對(duì)這一問題,測(cè)試機(jī)構(gòu)PassMark正在積極努力,將受影響的OpenCL代碼遷移到64位,以便能夠準(zhǔn)確測(cè)試RTX 50系列顯卡的性能。然而,PassMark也指出,如果不修改源代碼,許多包含32位OpenCL組件的應(yīng)用程序可能永遠(yuǎn)無(wú)法在RTX 50系列上正常運(yùn)行。
PassMark還提到,RTX 50系列在Direct X9性能上的不佳表現(xiàn)可能還涉及其他架構(gòu)變化。這顯示了NVIDIA在追求性能提升的同時(shí),也面臨著如何平衡新架構(gòu)與現(xiàn)有應(yīng)用兼容性的挑戰(zhàn)。NVIDIA的這一決策不僅影響了性能測(cè)試的結(jié)果,還可能對(duì)用戶的實(shí)際使用體驗(yàn)產(chǎn)生影響。
業(yè)界人士認(rèn)為,NVIDIA需要在未來的產(chǎn)品更新中更加關(guān)注與現(xiàn)有應(yīng)用的兼容性,以確保用戶能夠無(wú)縫過渡到新一代顯卡。同時(shí),測(cè)試機(jī)構(gòu)和開發(fā)人員也需要不斷適應(yīng)新技術(shù)的發(fā)展,更新和優(yōu)化測(cè)試工具及應(yīng)用程序,以準(zhǔn)確評(píng)估新硬件的性能。只有這樣,才能確保顯卡市場(chǎng)的健康發(fā)展,滿足用戶對(duì)高性能顯卡的期待。