Apple dahil pek çok dev, yapay zekası için YouTube’dan veri “çalıyor”
Proof News’in yeni bir incelemesinin keşfettiğine göre, dünyanın en büyük teknoloji şirketlerinden bazılarının, AI modellerini 173.000’den fazla YouTube videosunun altyazılarını içeren bir veri seti üzerinde, izinsiz olarak eğittiği ortaya çıktı.
EluetherAI adlı kar amacı gütmeyen kuruluş tarafından oluşturulan veri seti, 48.000’den fazla kanalın YouTube videolarının altyazılarını içeriyordu ve diğer pek çok şirketin yanı sıra Apple, NVIDIA ve Anthropic de bu olaya dahil. Araştırmanın sonuçları, AI teknolojisinin çoğunlukla yaratıcılardan izinsiz veya tazminatsız alınan verilerle kurulduğu gerçeğini bir kez daha gösteriyor.
Veri seti YouTube’dan herhangi bir video veya görsel içermiyor olsa da, aralarında Marques Brownlee ve MrBeast’in de bulunduğu platformun en büyük içerik oluşturucularından bazılarını ve New York Times, BBC ve ABC News gibi büyük haber yayıncılarını içeriyor.
Daha önce Google, şirketlerin AI eğitimi için YouTube verilerini kullanmalarının platformun kullanım şartlarını ihlal edebileceğini belirtmişti ve Engadget ile konuşan bir Google sözcüsü bu durumun geçerliliğini hala koruduğunu bildirdi. Ancak henüz Apple, NVIDIA, Anthropic veya EleutherAI konu hakkında bir açıklama yapmış değil.
AI şirketleri genellikle modellerini eğitmek için kullanılan verilerin kaynağı hakkında pek şeffaf davranmıyor. Pek çok sanatçı bu durumdan şikayetçi olurken, şirketler soruları cevaplamaktan kaçınmaya devam ediyor. Özellikle dünyanın en büyük video deposu olan YouTube gibi platformlar, yazıları, sesleri, videoları ve fotoğrafları içeren çok çekici kaynaklar haline dönüşüyor. Ancak Alphabet CEO’su Sundar Pichai’nin de söylediği üzere, şirketlerin YouTube verilerini kendi AI modellerini eğitmek için kullanmaları önemli bir ihlal teşkil ediyor.