The New York Times’tan Büyük İddia OpenAI Eğitim Verilerini YouTube Videolarından Aldı
The New York Times’ın ortaya koyduğu iddialara göre, OpenAI, gelişmiş yapay zeka modeli GPT-4’ü eğitmek amacıyla, YouTube videolarından büyük miktarda veri topladı. Bu süreçte geliştirilen ve ‘Whisper’ adı verilen konuşma tanıma aracı, YouTube videolarının seslerini metne dönüştürerek, yapay zekanın daha “akıllı” hale gelmesi için yeni konuşma metinleri sağladı.
OpenAI ChatGPT-4 Eğitimi için Bir Milyondan Fazla Saatlik YouTube Videosunu Metne Dönüştürdü
Kaynaklara göre, OpenAI, en son yapay zeka sistemini geliştirirken, internet üzerindeki saygın İngilizce metin kaynaklarının tümünü tüketti ve teknolojisinin bir sonraki versiyonunu eğitmek için daha fazla veriye ihtiyaç duydu. Bu nedenle, OpenAI araştırmacıları, YouTube videolarının sesini metne dönüştürebilen Whisper adlı bir konuşma tanıma aracı geliştirdi. OpenAI ekibi, OpenAI’nin başkanı Greg Brockman’ın da aralarında bulunduğu bir ekip ile birlikte, bir milyondan fazla saatlik YouTube videosunu metne dönüştürdü. Dönüştürülen bu metinler, dünya çapında en güçlü yapay zeka modellerinden biri olarak kabul edilen ve son ChatGPT chatbot’unun temelini oluşturan GPT-4 sistemine beslendi.
Veri İhlali Tartışmaları
Ancak, bu yöntem, YouTube’un kendi kullanım koşullarına potansiyel bir meydan okuma teşkil ediyor. Google’ın sahip olduğu video platformu, içeriklerinin video platformundan “bağımsız” uygulamalar için kullanılmasını yasaklıyor. OpenAI’nin bu adımı, platformun kurallarını ihlal ediyor olabilir. Üstelik OpenAI çalışanları arasında bu hareketin YouTube’un kurallarına aykırı olabileceği yönünde tartışmaların yaşandığı belirtiliyor.
The New York Times’ın incelemesine göre, yapay zeka teknolojisini ilerletmek için dijital verilere ihtiyaç duyan OpenAI, Google ve Meta gibi teknoloji şirketleri, kurumsal politikaları görmezden gelme, hukuku eğme ve köşeleri kesme eğiliminde.
Bu iddialar, yapay zeka teknolojisini ilerletmek için gerekli dijital verileri elde etme yarışının etik ve yasal sorunlarını gözler önüne seriyor. Teknoloji şirketleri, yasal ve etik sınırları zorlayan yöntemlere başvurarak, yapay zekalarını daha da geliştirmek için gerekli veri havuzlarını genişletme çabasında. OpenAI, Google ve Meta gibi teknoloji devleri, bu süreçte kurumsal politikaları ve hukuki sınırları göz ardı ederek, veri toplama konusunda cesur adımlar atmış görünüyor.
OpenAI’nin bu hamlesi, yaratıcıların eserlerinin yapay zeka şirketleri tarafından izinsiz kullanımı üzerine yükselen endişeleri de tetikliyor. The New York Times’ın geçen yıl OpenAI ve Microsoft’a karşı açtığı dava, bu endişelerin somut bir örneği. İddialar, yapay zeka çağında telif haklarının nasıl korunacağına dair daha geniş bir tartışmanın parçası haline geldi.
OpenAI ve diğer teknoloji şirketlerinin, yapay zeka sistemlerini geliştirmek için kullandıkları yöntemler ve bu yöntemlerin yasal, etik ve sosyal etkileri, teknolojinin sınırlarını keşfetme konusunda önemli soruları beraberinde getiriyor.
Konuyla ilgili ise OpenAI’dan henüz bir açıklama gelmedi.
Diğer Trendler!
> Sıradaki Trend!








