Kami sangat senang untuk membagikan hasil kolaborasi kami dengan SGLang. 🎉



Bersama-sama, kami mengoptimalkan inferensi DeepSeek R1 untuk penyebaran di GB200 NVL72—memberikan peningkatan 2x dan 3x per GPU dibandingkan dengan kluster H100 yang hampir dua kali lipat ukuran.

Inilah seperti apa inferensi MoE perbatasan.
LOOKS-5.48%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 7
  • Bagikan
Komentar
0/400
ProbablyNothingvip
· 6jam yang lalu
Perkalian kinerja, saya menjilat, saya menjilat
Lihat AsliBalas0
WhaleWatchervip
· 08-01 23:52
Kinerja meningkat dua kali lipat, luar biasa!
Lihat AsliBalas0
Rugpull幸存者vip
· 08-01 23:52
Jadi, kamu sedang membahas performa lagi, ya?
Lihat AsliBalas0
OnChainDetectivevip
· 08-01 23:52
hmm melacak metrik gpu itu... ada yang tidak sesuai di sini
Lihat AsliBalas0
MetaverseVagabondvip
· 08-01 23:50
Wah, akhirnya bisa mengalahkan H100!
Lihat AsliBalas0
ClassicDumpstervip
· 08-01 23:46
又跟着To da moon了吧
Lihat AsliBalas0
WhaleMinionvip
· 08-01 23:36
Kinerja GPU meledak.
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)