亚洲AV日韩AⅤ欧美AVAV天堂

  • <thead id="dctjv"><option id="dctjv"></option></thead>

  • 導航菜單

    英偉達推出首款Pascal顯卡即怪異的Tesla P100

    首款基于Nvidia全新Pascal架構的全功能GPU。盡管Tesla P100是針對專業人士和深度學習系統而不是針對消費者的,但如果消費者Pascal GPU是類似的東西-并且它們很有可能成為現實-游戲玩家和發燒友都將看到性能的巨大提升。

    該 特斯拉P100是第一個全尺寸的Nvidia GPU基于所述TSMC 16nm以下的FinFET制造工藝狀AMD,NVIDIA一直停留使用較舊的28nm工藝自2012年以來,和第一到特征的第二代高帶寬存儲器的(HBM2) 。三星在一月份開始批量生產更快,更高容量的HBM2內存。盡管最近有傳言稱Nvidia和AMD都將由于其價格過高而在今年不使用HMB2,但實際上,AMD的最新路線圖表明其新的Polaris GPU將不會使用HBM2,但 Nvidia至少在其專業人士方面取得了飛躍系列的GPU。

    P100更高效的制造流程,架構升級和HBM2的結果大大提高了英偉達當前性能冠軍(如基于Maxwell的Tesla M40和Titan X / Quadro M6000)的性能。英偉達表示,P100的半精度(FP16)浮點性能達到21.2 Teraflop,單精度(FP32)為10.6 teraflop,雙精度為5.3 teraflops(1/2速率)。相比之下,Titan X和Tesla M40僅提供7 teraflops的單精度浮點性能。

    得益于更寬的4096位內存總線,內存帶寬在Titan X上達到720GB / s的兩倍以上,而容量高達16GB。有趣的是,Tesla P100甚至不是完全啟用的Pascal版本。它基于該公司的新GP100 GPU,并啟用了60個流式多處理器(SM)中的56個。GP100芯片的表面積為610平方毫米,與GM200 Titan X大致相同。由于采用了較小的16納米工藝,因此與其縮小芯片,Nvidia并沒有選擇簡單地將相同的空間填滿一個還有更多的晶體管(精確地說是153億個),幾乎是高端GM200 Maxwell芯片的兩倍。

    雖然Nvidia尚未公開Pascal架構的所有底層細節,但從初始信息中可以收集到一些有趣的花絮。核心時鐘為1328MHz,升壓時鐘為1480MHz,均遠高于基于Maxwell的GPU,以及300W TDP。Pascal的每個SM具有64個FP32 CUDA內核,而Maxwell具有128個,每個SM也包含32個FP64 CUDA內核。這導致了雙精度浮點數的1/2速率性能。Pascal還能夠在單個FP32 CUDA內核中打包兩個FP16操作。HBM2存儲器以四個4GB堆棧進行布局,每個堆棧具有1024位的寬度,總共有4096位的內存總線。

    P100還支持NVLink,這是一種專有互連技術,早在2014年就宣布推出,該技術可使多個GPU直接相互連接或以比PCI Express 3.0當前提供的帶寬高得多的帶寬支持CPU。它還支持多達八個GPU連接,而不是四個PCIe和SLI。

    Nvidia首席執行官黃仁勛在2014年最初宣布NVLink時表示:“ GPU的內存快而小,而CPU的內存快而慢。” “加速的計算應用程序通常將數據從網絡或磁盤存儲移動到CPU內存,然后將數據復制到GPU內存,然后再由GPU處理。通過NVLink,數據可以以更快的速度在CPU內存和GPU內存之間移動。 ,使GPU加速的應用程序運行得更快。”

    Huang當時還嘲笑包裝Pascal圖形的系統的速度將比基于Maxwell的系統快10倍,但是在GTC 2016上,他發布P100時提高了賭注,他說某些任務的速度會提高12倍增加速度。他聲稱,在Maxwell加速的PC上在25小時內完成的任務在Pascal系統上可能僅需兩個小時。

    鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

    亚洲AV日韩AⅤ欧美AVAV天堂
  • <thead id="dctjv"><option id="dctjv"></option></thead>