🔧 GB10 實測 DiffusionGemma 26B 挑戰 32K 極限
Nachrichtenbereich: 🔧 Programmierung
🔗 Quelle: dev.to
作為三平台評測的最終章(前兩篇為 M2 Max 96GB MLX 與 GH200 vLLM),本篇將完整測試一下 GB10 的吞吐量表現、32K 長 Context 的速度代價、以及在 Podman 部署時讓人抓狂的 OOM 踩坑紀錄。
在數據的結果來看,155 tok/s,比 M2 Max 快了整整 10 倍! 更重要的是,Context 長度一路從 2K 解鎖到... [Weiterlesen]
🔧 GB10 實測 DiffusionGemma 26B 挑戰 32K 極限
📈 486.95 Punkte
🔧 Programmierung
🔧 DiffusionGemma 26B 挑戰 GH200 效能極限
📈 189.8 Punkte
🔧 Programmierung
🔧 How to Run Your Own Local LLM — 2026 Edition
📈 118.86 Punkte
🔧 Programmierung
🔧 DiffusionGemma: The Developer Guide
📈 48.57 Punkte
🔧 Programmierung
📰 DiffusionGemma: 4x faster text generation
📈 48.57 Punkte
📰 IT Nachrichten