Microsoft, kendi geliştirdiği ilk yapay zeka hızlandırıcı çipi Maia 100 hakkında yeni ayrıntıları açıkladı. Şirket, bu yılın başında Build geliştirici konferansında duyurduğu Maia 100’ün, TSMC’nin 5nm teknolojisiyle üretildiğini ve AI iş yükleri için optimize edildiğini belirtti. Hot Chips 2024 etkinliğinde paylaşılan teknik bilgiler, çipin yenilikçi mimarisini ve sunduğu özellikleri gözler önüne seriyor.
Maia 100’ün Öne Çıkan Teknik Özellikleri:
- Çip Boyutu: 820mm²
- Paketleme: COWOS-S ara bağlantı teknolojisi ile TSMC N5 işlemi
- Bellek Kapasitesi ve Bant Genişliği: 64GB HBM2E, 1,8TB/s
- Tepe Yoğun Tensör Performansı: 6bit için 3 POPS, 9bit için 1,5 POPS, BF16 için 0,8 POPS
- L1/L2 Bellek: 500MB
- Ağ Bant Genişliği: 600GB/s (12x400GbE)
- Ana Bilgisayar Bant Genişliği (PCIe): 32GB/s, PCIe Gen5x8
- Tasarım TDP: 700W, Tedarik TDP: 500W
Maia 100, Microsoft’un maliyeti ve performansı optimize etmek için dikey olarak entegre ettiği bir sistemin parçası olarak tasarlanmıştır. Bu sistem, özel sunucu kartları ve raflar, performansı artıran bir yazılım yığını ve büyük ölçekli AI iş yüklerini desteklemek için çeşitli yazılım araçları içerir.
Maia 100 SoC Mimarisi:
- Tensör Birimi: Yüksek hızlı işleme için 16xRx16 biriminden oluşur ve çok çeşitli veri türlerini destekler.
- Vektör İşlemcisi: FP32 ve BF16 dahil olmak üzere farklı veri türlerini destekleyen, gevşek bağlı süperskalar bir işlemci.
- DMA Motoru: Farklı tensör parçalama şemalarını destekler.
- Donanım Semaforları: Eşzamansız programlamayı etkinleştirir.
- Büyük L1 ve L2 Bellek Yönetimi: Yazılım tarafından yönetilir, veri kullanımı ve güç verimliliği artırılır.
- Ethernet Tabanlı Ara Bağlantı: Ultra yüksek bant genişliği hesaplaması için özel bir RoCE benzeri protokol ile sağlanır. 4800 Gbps’ye kadar toplama ve 1200 Gbps’ye kadar her şeyden her şeye bant genişliği destekler.
Yazılım Entegrasyonu ve Geliştirici Araçları:
Maia 100’ün yazılım geliştirme kiti (SDK), geliştiricilerin PyTorch ve Triton modellerini hızla Maia’ya taşımasına olanak tanır. Geliştiriciler, Maia sistemini programlamak için Triton veya Maia’ya özgü bir programlama modeli olan Maia API arasında seçim yapabilirler. Maia, PyTorch modellerini tek satır değişikliğiyle çalıştırmayı destekler, bu da geliştirme sürecini kolaylaştırır.
Maia 100’ün gelişmiş mimarisi, güçlü geliştirici araçları ve Azure entegrasyonu, Microsoft’un yapay zeka iş yüklerini yönetme şeklini değiştirmeyi hedefliyor. Ancak Microsoft’un, Google’ın TPU’ları veya Amazon’un Trainium ve Inferentia çiplerinde olduğu gibi Maia 100 hızlandırıcılarını üçüncü taraf kuruluşlara açıp açmayacağı henüz bilinmiyor.
Maia 100 ile ilgili daha fazla bilgiye Microsoft’un resmi blog yazısından ulaşabilirsiniz.