OpenAI ChatGPT-4o Yeni Dönem Başlıyor

OpenAI ChatGPT-4o Modeli Ücretsiz Olarak Kullanıma Sunuldu

OpenAI beklenen yeni yapay zeka modeli GPT-4o’yu tanıttı ve bu modeli ücretsiz olarak kullanıma açtı. GPT-4o; ses, görsel ve metin üzerinde gerçek zamanlı akıl yürütebiliyor. Dün akşam OpenAI kanallarından canlı yayınla tanıtılan GPT-4o, GPT-4 seviyesinde zeka sunarken daha hızlı çalışıyor ve metin, ses ve görsel yeteneklerde önemli iyileştirmeler sağlıyor.

GPT-4o’nun Öne Çıkan Özellikleri

OpenAI, GPT-4o modelini insan-bilgisayar etkileşiminde önemli bir adım olarak nitelendiriyor. Bu yeni model, kullanıcıların metin, ses ve görüntü gibi çeşitli veri türlerini aynı anda girdi olarak kullanabilmesini sağlıyor. Aynı zamanda, bu farklı veri türlerini birleştirerek çıktı üretebiliyor. Örneğin, bir ses kaydını dinleyip analiz edebiliyor, bir görüntüyü yorumlayabiliyor ve metin yazarak yanıt verebiliyor.

GPT-4o, sesli girdilere çok hızlı yanıt verebiliyor. Ortalama yanıt süresi 320 milisaniye, bu hız insanın konuşma sırasında verdiği tepkilere oldukça yakın. Bu özellik, modelin daha doğal ve akıcı bir etkileşim sağlamasına yardımcı olacak.

GPT-4o’nun API kullanımı %50 daha ucuz ve önceki modellere kıyasla çok daha hızlı. Bu da onu, hem bireysel kullanıcılar hem de geliştiriciler için daha erişilebilir ve ekonomik bir seçenek haline getiriyor. GPT-4o, özellikle görsel ve sesli anlama yeteneklerinde mevcut modellerden çok daha üstün performans gösteriyor. Bu sayede, resimleri ve ses dosyalarını daha doğru ve hızlı bir şekilde analiz edebiliyor, bu da onun geniş bir kullanım alanına sahip olmasını sağlıyor.

Modelin Gücü ve Yenilikleri

GPT-4o, İngilizce ve programlama dilleri konusundaki performansını GPT-4 Turbo ile eşit hale getirdi. Ayrıca bu yeni model, İngilizce dışındaki dillerde de önemli ilerlemeler kaydetti. GPT-4o, metin, ses ve görüntü verilerini tek bir sinir ağı kullanarak işliyor; bu da modelin konuşma tonu, birden fazla konuşmacı ve arka plan sesleri gibi ayrıntıları doğrudan anlamasına olanak tanıyor.

Önceki modellerde, sesli girdiler önce metne çevriliyor, ardından metin işleniyor ve son olarak tekrar sese dönüştürülüyordu. Bu üç aşamalı süreç, önemli bilgilerin kaybolmasına neden oluyordu. Ancak, GPT-4o tüm bu işlemleri tek bir sinir ağıyla yaptığı için, bu bilgi kaybı sorunu ortadan kalktı.

GPT-4o, klasik testlerde GPT-4 Turbo ile aynı seviyede performans gösteriyor. Ancak, özellikle çok dilli, sesli ve görsel yeteneklerde daha da iyi sonuçlar elde ediyor. Model, sesli tanıma ve çeviri konularında Whisper-v3’ü geride bırakarak büyük ilerlemeler kaydetti ve farklı dillerde yapılan M3Exam testlerinde GPT-4’ten daha başarılı oldu.

Güvenlik ve Sınırlamalar

GPT-4o, farklı veri türleri arasında güvenliği sağlamak amacıyla tasarlanmış bir model olarak dikkat çekiyor. OpenAI duyurusunda, modelin eğitimi sırasında kullanılan verilerin özenle filtrelendiği ve modelin davranışlarının eğitim sonrası çeşitli tekniklerle iyileştirildiği, böylece modelin güvenli ve doğru sonuçlar vermesinin amaçlandığı belirtiliyor.

OpenAI, yeni modeli GPT-4o’nun siber güvenlik, kimyasal ve biyolojik tehditler (CBRN), ikna kabiliyeti ve modelin özerkliği gibi alanlarda orta risk seviyesinin üzerine çıkmadığını belirtiyor. Ayrıca, sosyal psikoloji, önyargı ve adalet, yanlış bilgi yayma gibi konularda 70’ten fazla bağımsız uzman tarafından kapsamlı testlere tabi tutulmuş.

Modelin sesli veri işleme yetenekleri yeni riskler taşıdığı için, şu an sadece metin ve görüntü girdileri ile metin çıktıları kamuya sunuluyor. Sesli çıktılar ise mevcut güvenlik politikalarına uygun olarak sınırlı sayıda önceden ayarlanmış seslerle sınırlandırılacak.

GPT2-Chatbot Gizemi Çözüldü

Yapay zeka dünyasında daha önce ortaya çıkan ve GPT-4o olabileceği speküle edilen ‘GPT2-Chatbot‘ hakkındaki gizem çözüldü. OpenAI, GPT-4o modelini LMSys Chatbot Arena’da “im-also-a-good-gpt2-chatbot” adı altında test ettiğini itiraf etti.

Modelin Kullanılabilirliği

GPT-4o’nun metin ve görüntü yetenekleri bugün itibarıyla ChatGPT’de kullanıma sunulmaya başladı. Model, Plus kullanıcıları için 5 kat daha yüksek mesaj limitleriyle kullanılabilir olacak. GPT-4o’nun yeni ses ve video yeteneklerinin ise önümüzdeki haftalarda API’de küçük bir güvenilir ortak grubuna sunulacağı söyleniyor.

GPT-4o’nun farklı kullanım senaryoları arasında şunlar yer alıyor: Mülakat hazırlığı, matematik problemleri çözme, gerçek zamanlı çeviri, müşteri hizmetleri uygulamaları…

GPT-4o, paylaştığınız görüntüleri anlama ve tartışma konusunda mevcut modellerden çok daha iyi. Örneğin, farklı bir dildeki bir menünün fotoğrafını çekip GPT-4o ile konuşarak menüyü çevirebilir, yemeklerin tarihi ve önemi hakkında bilgi alabilir ve öneriler alabilirsiniz. Gelecekteki geliştirmelerle daha doğal, gerçek zamanlı sesli sohbet ve gerçek zamanlı video ile ChatGPT ile konuşma yeteneği mümkün olacak. Örneğin, bir spor karşılaşmasını canlı olarak gösterip kurallarını açıklamasını isteyebileceksiniz.

ChatGPT Masaüstü Uygulaması Geliyor

OpenAI, ücretsiz ve ücretli kullanıcılar için macOS için yeni ChatGPT masaüstü uygulamasını da kullanıma sunduğunu duyurdu. Bu uygulama, bilgisayarınızda yaptığınız her şeye sorunsuz bir şekilde entegre olacak şekilde tasarlanmış. Basit bir klavye kısayolu (Option + Space) ile anında ChatGPT’ye soru sorabilir ve uygulama içinde ekran görüntüleri üzerinde çalışabilirsiniz. Uygulamanın bu yıl içinde bir Windows sürümünün de piyasaya sürülmesi planlanıyor.

> Sıradaki Trend!

Featured image for “Anthropic Economic Index Raporunu Yayımlandı”

Anthropic Economic Index Raporunu Yayımlandı

Yapay zekâ sistemleri geliştirmeye odaklanan bir araştırma olan Anthropic, iş gücü piyasasında yapay zekânın gerçek etkilerini anlamak için kapsamlı bir analiz yayımladı. Anthropic Economic Index, milyonlarca veriyi inceleyerek AI’nin hangi sektörlerde, hangi görevlerde ve nasıl kullanıldığını ortaya koyuyor.