創寶來科技芯資訊:全球首款 GDDR7 DRAM面世,三星造!
發布時間:2023/7/21
去年,三星公布了為 GPU 和服務器開發 GDDR7 DRAM的計劃。今年早些時候,該公司透露了有關這些存儲芯片的更多細節。今天,三星宣布已完成 GDDR7 DRAM 芯片的開發,該芯片將用于未來的汽車、游戲機、個人電腦、服務器和工作站。它是世界上第一家完成此類先進存儲芯片開發的公司。
三星的GDDR7 DRAM 擁有破紀錄的 1.5TBps 帶寬,比 GDDR6 DRAM 高出 40%。得益于 PAM3(脈沖幅度調制)信號方法的增強,它的每引腳速度為 32Gbps。PAM3 是一種新的內存標準,允許在同一信令周期內發送多 50% 的數據。GDDR6 等上一代內存芯片使用 NRZ(不歸零)信號發送方法。這些新型內存芯片的能效也比 GDDR6 DRAM 芯片高出 20%。三星還為其新芯片提供了較低電壓的選擇,該芯片專門針對筆記本電腦和其他此類設備而設計。
為了減少熱量產生,除了 IC 架構優化之外,三星還在封裝中使用了新型 EMC(環氧樹脂模塑料)材料,它具有高導熱性。所有這些改進使熱阻降低了 70%,從而提供了更穩定的產品,即使在高壓力的操作條件下也能表現良好。三星的重要客戶將于今年開始測試DGGR7 DRAM芯片進行驗證。我們預計這些新芯片將用于Nvidia 的RTX 50 系列 GPU。
三星電子內存產品規劃團隊執行副總裁 Yongcheol Bae 表示:“我們的 GDDR7 DRAM 將有助于提升工作站、PC 和游戲機等需要出色圖形性能的領域的用戶體驗,并且預計將擴展到未來人工智能、高性能計算 (HPC) 和汽車等應用。下一代圖形 DRAM 將根據行業需求推向市場,我們計劃繼續保持在該領域的領先地位。”
當三星去年 10 月嘲笑GDDR7 內存的持續開發時, Cadence 沒有透露即將推出的規范的任何其他技術細節。但他們最近透露了有關該技術的一些額外細節。事實證明,GDDR7 內存將使用 PAM3 和 NRZ 信號,并將支持許多其他功能,目標是達到每個引腳高達 36 Gbps 的數據速率。
簡短的 GDDR 歷史課
在較高的層面上,近年來 GDDR 內存的發展相當簡單:更新的內存迭代提高了信號速率,增加了突發大小(burst size)以跟上這些信號速率,并提高了通道利用率。但是這些都沒有顯著增加存儲單元的內部時鐘。例如,GDDR5X 和后來的 GDDR6 將其突發大小增加到 16 字節,然后切換到雙通道 32 字節訪問粒度。雖然每一代技術都面臨著挑戰,但最終行業參與者已經能夠通過每個版本的 GDDR 提高內存總線的頻率,以保持性能的提升。
但即使是“簡單”的頻率增加也越來越變得不那么簡單了。這促使該行業尋找除了加快時鐘之外的解決方案。
借助 GDDR6X,美光和 NVIDIA 將傳統的不歸零 (NRZ/PAM2) 編碼替換為四級脈沖幅度調制 (PAM4) 編碼。PAM4 使用四個信號電平將有效數據傳輸速率提高到每個周期兩個數據位,從而實現更高的數據傳輸速率。實際上,由于 GDDR6X 在 PAM4 模式下運行時具有 8 字節 (BL8) 的突發長度(burst length),因此在相同數據速率(或者更確切地說,信號速率)下它并不比 GDDR6 快,而是設計為能夠達到比 GDDR6 可以輕松實現的更高的數據速率。
四級脈沖幅度調制在信號丟失方面優于 NRZ。對于給定的數據速率,由于 PAM4 需要 NRZ 信號傳輸波特率的一半,因此產生的信號損失顯著減少。隨著更高頻率的信號在通過導線/走線時衰減得更快——而且按照數字邏輯標準,內存走線的距離相對較長——能夠在本質上是較低頻率的總線上運行,最終使一些工程和走線更容易實現更高的數據速率。
權衡(trade-off )是 PAM4 信號通常對隨機和感應噪聲更敏感;為了換取較低頻率的信號,您必須能夠正確識別兩倍的狀態。實際上,這會導致給定頻率下的誤碼率更高。為了降低BER,需要在Rx端進行均衡,在Tx端進行預補償,這會增加功耗。雖然它未用于 GDDR6X 內存,但在更高頻率(例如 PCIe 6.0)下,前向糾錯 (FEC) 也是一項實際要求。
當然,GDDR6X 內存子系統需要全新的內存控制器,以及用于處理器和內存芯片的全新物理接口 (PHY)。這些復雜的實現在很大程度上是四級編碼直到最近才幾乎完全用于高端數據中心網絡的主要原因,在這些網絡中有支持使用這種尖端技術的利潤。
GDDR7:PAM3 編碼高達 36 Gbps/pin
考慮到上述在使用 PAM4 信號或 NRZ 信號時的權衡,事實證明支持 GDDR7 內存標準的 JEDEC 成員反而采取了一些折衷的立場。GDDR7 內存設置為使用 PAM3 編碼進行高速傳輸,而不是使用 PAM4。
顧名思義,PAM3 介于 NRZ/PAM2 和 PAM4 之間,使用三級脈沖幅度調制(-1、0、+1)信號,允許它每個周期傳輸 1.5 位(或者更確切地說是 3 位以上)兩個周期)。PAM3 提供比 NRZ 更高的每周期數據傳輸速率——減少了遷移到更高內存總線頻率的需要以及由此帶來的信號丟失挑戰——同時需要比 PAM4 更寬松的信噪比。總的來說,GDDR7 承諾比 GDDR6 具有更高的性能,同時比 GDDR6X 具有更低的功耗和實施成本。
對于那些記分的人來說,這實際上是我們看到的第二個使用 PAM3 的主要消費技術。出于類似的技術原因,USB4 v2(又名 80Gbps USB)也在使用 PAM3。那么 PAM3 到底是什么?
PAM3 是一種數據線可以承載 -1、0 或 +1 的技術。該系統所做的實際上是將兩個 PAM3 傳輸組合成一個 3 位數據信號,例如 000 是一個 -1 后跟一個 -1。這變得很復雜,所以這里有一個表格:
當我們將 NRZ 與 PAM3 和 PAM4 進行比較時,我們可以看到 PAM3 的數據傳輸速率處于 NRZ 和 PAM4 的中間。在這種情況下使用 PAM3 的原因是為了在沒有 PAM4 需要啟用的額外限制的情況下實現更高的帶寬。
話雖如此,三星承諾的具有 36 Gbps 數據傳輸速率的 256 位內存子系統將使用多少功率還有待觀察。GDDR7 規范本身尚未獲得批準,硬件本身仍在構建中(這正是 Cadence 等工具發揮作用的地方)。但請記住,AI、HPC 和圖形的帶寬需求量很大,帶寬將永遠受到歡迎。
優化效率和功耗
除了提高吞吐量外,GDDR7 有望采用多種方式來優化內存效率和功耗。特別是,GDDR7 將支持四種不同的讀取時鐘 (RCK) 模式,以便僅在需要時啟用它:
始終運行:始終運行并在睡眠模式下停止;
禁用:停止運行;
Start with RCK Start command:主機可以在讀出數據之前通過發出RCK Start命令來啟動RCK,并在需要時使用RCK Stop命令停止。
Start with Read:當 DRAM 收到任何涉及讀出數據的命令時,RCK 自動開始運行。它可以使用 RCK Stop 命令停止。
此外,GDDR7 內存子系統將能夠并行發出兩個獨立的命令。例如,Bank X 可以通過在 CA[2:0] 上發出 Refresh per bank 命令來刷新,而 Bank Y 可以通過同時在 CA[4:3] 上發出讀取命令來讀取。此外,GDDR7 將支持線性反饋移位寄存器 (LFSR) 數據訓練模式,以確定適當的電壓電平和時序,以確保一致的數據傳輸。在這種模式下,主機將跟蹤每個單獨的眼睛(連接),這將允許它應用適當的電壓以更好地優化功耗。
最后,GDDR7 將能夠根據帶寬需求在 PAM3 編碼和 NRZ 編碼之間切換。在高帶寬場景中,將使用 PAM3,而在低帶寬場景中,內存和內存控制器可以切換到更節能的 NRZ。
雖然 GDDR7 承諾在不大幅增加功耗的情況下顯著提高性能,但技術觀眾最大的問題可能是 新型內存何時可用。由于沒有來自 JEDEC 的硬性承諾,因此沒有預計 GDDR7 發布的具體時間表。但考慮到所涉及的工作和 Cadence 驗證系統的發布,預計 GDDR7 將與 AMD 和 NVIDIA 的下一代 GPU 一起進入現場并不是沒有道理的。請記住,這兩家公司傾向于以大約兩年的節奏推出新的 GPU 架構,這意味著我們將在 2024 年晚些時候開始看到 GDDR7 出現在設備上。
當然,鑒于如今有如此多的 AI 和 HPC 公司致力于帶寬需求高的產品,其中一兩家可能會更快發布依賴 GDDR7 顯存的解決方案。但 GDDR7 的大規模采用幾乎肯定會與 AMD 和 NVIDIA 的下一代圖形卡的量產同時發生。