Grafik işlemciler, elektrik ihtiyacı ve kullanıcı verisi
Üretken yapay zekâ aracılığı ile oluşturulacak yeni teknolojik ekosistem gelecek on yıla ilişkin en fazla merak uyandıran konuların başında geliyor. Dikkatli bakıldığında bugünden bazı ipuçlarını fark etmek mümkün.
Bulut üzerinden çalışan yazılım şirketleri ve büyük sosyal medya oyuncuları, yapay zekâ yazılımlarının kullandığı sunucularda yer alan grafik işlemcileri aylardır stokluyor. Bu gelişmiş işlemcilerin bazı modellerinin Çin’e ihracının yasaklanması gündeme geldiğinden bu yana, Çin’li teknoloji şirketlerinin yüklü önden talebi de bu stoklama eğilimini destekledi. Birkaç şirketin sınırlı üretim kapasitesi ile üretebildiği bu çip setlerinde adeta karaborsa oluşmuş durumda, piyasadaki fiyatlar üreticinin satış fiyatının birkaç katına çıkabiliyor. Yılbaşından bu yana, bu grafik işlemcileri üreten şirketin hissenin %20 değer kazanmasının ardında bu var. Bu bağımlılığı azaltmak için Amazon, Google, Microsoft ve Meta kendi çiplerini (Trainium, Tensor, Maia 100 ve MTIA) tasarlama ve ürettirme çabası içinde. Bu çabalar meyve verirse, yarıiletken endüstrisinde kartlar tekrar dağıtılır.
Bulut sunucularında elektrik tüketimi de çiplerin hesaplama kapasitelerine paralel olarak artıyor. Üç milyon H100 grafik işlemcisinin elektrik tüketimi, küçük bir devletin toplam tüketimini aşmış durumda. Önümüzdeki yıllarda elektrikli araç satışlarının artması ve üretken yapay zekâ uygulamalarını besleyecek büyük veri merkezlerinin elektrik tüketimi, özellikle yenilenebilir enerji ihtiyacını daha da artıracak. Büyük petrol şirketlerinin deniz açıklarındaki rüzgar enerjisi yatırımları bu artan taleple daha fizibil hale gelebilir. Küçük modüler nükleer reaktörlerin de veri tabanlarının elektrik talebini karşılamak için kullanılması gündemde ve yapay zeka geliştiricilerinin aynı zamanda bu reaktörleri geliştirmek için kurulan Helion, Oklo ve Avalanche gibi şirketlere yatırım yapması dikkat çekiyor.
ChatGPT gibi dil modelleri etkili iletişim için yüksek nitelikli gerçek veri setlerine ihtiyaç duyuyor. Şimdiye kadar çevrimiçi gazete makaleleri, haber içerikleri gibi açık kaynaklardan elde edilen veri setleri yoğun olarak kullanıldı. Aralık ayında New York Times gazetesinin Microsoft ve OpenAI şirketlerini, makalelerini kendisine ödeme yapmadan yapa zeka robotlarını eğitmek için kullanmaları nedeni ile mahkemeye vermesi, haber siteleri ve gazetelerin veri setlerinin ücretsiz olarak kullanımının devam edemeyeceği gerçeğini ortaya koydu. X’in kullanıcılarının paylaşımlarına topluca erişim için fiyat tarifelerini belirlemesi, Reddit’in de API üzerinden forumlardaki metinlerin kullanımını ücretli hale getirmesi, aslında bildiğimiz bir gerçeğin yapay zeka modellerinin veri ihtiyacı üzerinden tekrar gündeme gelmesine yol açtı: Bedava aldığımız her hizmette, ödemediğimiz ücret sağladığımız veri üzerinden kazanılıyor.
ChatGPT ve Ernie gibi dil modelleri kendi “sentetik” verilerini üretmeye başladıysa da, bu veriler gerçek insanlar tarafından üretilen verilerin henüz yerini tutamıyor. Büyük teknoloji şirketlerinin önümüzdeki yıllarda yaygın ve kaliteli kullanıcı verilerine sahip, spor, haber, hobi alanları, finans piyasaları gibi farklı alanlarda içerik üreten ve kullanıcı yorumları alan portalları, ellerindeki kaliteli ve her gün büyüyen veri setlerine erişebilmek amacıyla satın aldığını göreceğiz.