●在算法過程中頻繁的數(shù)據(jù)混洗使得NTT難以在計(jì)算集群中分布,無法并行計(jì)算,并且由于需要從大型數(shù)據(jù)集中加載和卸載數(shù)據(jù),在硬件上運(yùn)行時(shí)需要大量帶寬。即使硬件操作很快,這可能也會(huì)導(dǎo)致速度變慢。例如,如果硬件芯片的內(nèi)存為16GB或更少,那么在100GB的數(shù)據(jù)集上運(yùn)行NTT將需要通過網(wǎng)絡(luò)加載和卸載數(shù)據(jù),這可能會(huì)大大降低操作速度。
綜上來看,內(nèi)存和帶寬是限制證明生成的主要瓶頸。對(duì)于顯卡來說,這里的內(nèi)存指的是顯存,并不是主板上的內(nèi)存,主板上的內(nèi)存主要是參與CPU的計(jì)算。當(dāng)然目前有些芯片技術(shù)可以打通主板上的內(nèi)存和顯存,讓內(nèi)存為顯存計(jì)算來用。
芯片的硬件指的是運(yùn)行指令的物理平臺(tái),包括處理器、內(nèi)存、存儲(chǔ)設(shè)備等等。芯片數(shù)據(jù)中常出現(xiàn)的“晶體管數(shù)量”、“7nm制程”、“存儲(chǔ)”等,往往指的就是硬件參數(shù)。
軟件則包括固件、驅(qū)動(dòng)程序、操作系統(tǒng)、應(yīng)用程序、算子、編譯器和開發(fā)工具、模型優(yōu)化和部署工具、應(yīng)用生態(tài)等等。這些軟件指導(dǎo)硬件如何響應(yīng)用戶指令、處理數(shù)據(jù)和任務(wù),同時(shí)通過特定的算法和策略優(yōu)化硬件資源的使用。芯片數(shù)據(jù)中常出現(xiàn)的“x86指令集”、“深度學(xué)習(xí)算子”、“CUDA平臺(tái)”等,往往指的就是芯片軟件。
早在2021年,英偉達(dá)就曾公開表示過“禁止使用轉(zhuǎn)換層在其他硬件平臺(tái)上運(yùn)行基于CUDA的軟件”,2024年3月,英偉達(dá)更是將其升級(jí)為“CUDA禁令”,直接添加在了CUDA的終用戶許可協(xié)議中,已禁止用轉(zhuǎn)譯層在其他GPU上運(yùn)行CUDA軟件