AiTrends'e Katıl!


Bize Katılın, İçeriklerinizi ve Haberlerinizi Bizimle Paylaşın!

Image
  • Yapay-zeka-etik-İlkeleri-ve-Hukuki-Duzenlemeler-Raporu
    AI Etik

    Yapay Zeka Etik İlkeleri ve Hukuki Düzenlemeler Raporu

    Türkiye Yapay Zeka İnisiyatifi (TRAI) hızla gelişen yapay zeka teknolojilerinin bilinçsiz kullanımının doğurabileceği zararları önlemek amacıyla hazırladığı “Yapay Zeka Etik İlkeleri ve Hukuki Düzenlemeler Raporu”nu yayınladı.

    -

    13 Haziran 2024
  • yapay-zeka-risklerine
    AI Etik

    Yapay Zeka Risklerine Karşı Çalışanlardan Açık Mektup

    OpenAI ile Google çalışanları, yapay zeka risklerine ilişkin tehlikeli gizlilik kültürüne dikkat çekmek amacıyla bir açık mektup yayımladı. Mektupta, YZ şirketlerinin güvenlik yerine finansal hedeflere odaklandığı ve çalışanların endişelerini dile getirmelerini engelleyen gizlilik anlaşmaları kullandığı belirtiliyor.

    -

    5 Haziran 2024
  • Scaleai-SEAL-leaderboards
    AI Etik / AI Trendleri

    Scale AI SEAL Leaderboards Projesini Tanıttı

    Yapay Zeka Değerlendirmelerinde Güvenilir Ölçüm için Scale AI Scale AI büyük dil modellerinin (LLM'ler) performansını tarafsız ve güvenilir bir şekilde sıralayan SEAL Leaderboards projesini tanıttı. Bu yeni değerlendirme sistemi, AI modellerinin gerçek dünya performansını daha iyi anlamamızı sağlayarak, AI gelişimini hızlandırmayı amaçlıyor. SEAL Leaderboards, yapay zeka topluluğunda daha şeffaf ve doğru bilgi akışını sağlayarak, yapay zeka teknolojilerinin güvenilirliğini artırmayı ve sorumlu AI uygulamalarının benimsenmesini teşvik etmeyi hedefliyor. Bu proje, AI araştırmacıları, geliştiricileri ve kullanıcıları için önemli bir değerlendirme aracı olarak konumlanıyor. SEAL Araştırma Laboratuvarı Güvenilir Değerlendirmeler için Merkez SEAL (Safety, Evaluations, and Alignment Lab), Scale AI tarafından kurulan ve AI modellerinin güvenliği, değerlendirilmesi ve hizalanmasına odaklanan bir araştırma laboratuvarı. SEAL, büyük dil modellerinin (LLM'ler) performansını tarafsız ve güvenilir bir şekilde değerlendirmek için özel olarak tasarlanmış. SEAL Leaderboards, büyük dil modellerini (LLM'ler) çeşitli alanlarda değerlendiren ve sıralayan bir dizi liderlik tablosu sunuyor. Bu tablolar, manipüle edilemeyen özel veri setleri ve uzman değerlendirmeleri ile oluşturulmuş. Manipüle Edilemez Sonuçlar: Scale AI'nin sahip olduğu özel değerlendirme veri setleri manipüle edilemez, bu da sonuçların tarafsız ve kirlenmemiş olmasını sağlıyor. Dinamik ve Yarışma Benzeri Ortam: Liderlik tabloları, yeni veri setleri ve modellerle periyodik olarak güncelleniyor, bu da dinamik ve yarışma benzeri bir ortam oluşturuyor. Yüksek Kalite ve Güvenilirlik: Değerlendirmeler, alan spesifik metodolojiler kullanarak inceleniyor ve uzmanlar tarafından bu değerlendirmelerin yapılması yüksek kalite ve güvenilirliği sağlıyor. SEAL Leaderboards'un Önemi: Tarafsız ve Güvenilir Değerlendirmeler SEAL Leaderboards projesi, AI topluluğu için büyük önem taşımakta. Şirketler, liderlik tablolarında birbirlerini geçmek için manipülasyon yapma eğilimi gösterebilir. Bu durum, AI sistemlerinin gerçekten gelişip gelişmediğini anlamayı zorlaştırabilir. SEAL Leaderboards Değerlendirme Kriterleri SEAL Leaderboards projesi, büyük dil modellerini dört ana kriter üzerinden değerlendiriyor: Kodlama (Coding): Modellerin programlama ve kod yazma yetenekleri değerlendirilir. Matematik (Math): Modellerin matematiksel problemleri çözme kabiliyeti ölçülür. Talimat Takibi (Instruction Following): Modellerin verilen talimatları doğru ve etkili bir şekilde takip etme becerisi değerlendirilir. İspanyolca (Spanish): Modellerin İspanyolca dilinde metinleri anlama, üretme ve çevirme yetenekleri incelenir. Liderlik Tablosu Sonuçlarının Analizi ve Değerlendirilmesi Kodlama Alanında Öne Çıkan Modeller Kodlama yeteneklerinin değerlendirildiği liderlik tablosunda, GPT-4 Turbo Preview modeli 1155 puanla birinci sırada yer alıyor. İkinci sırada yer alan GPT-4o modeli 1144 puan alarak, kodlama yeteneklerinde oldukça güçlü bir performans sergiledi. Üçüncü sırada ise 1112 puanla Gemini 1.5 Pro (Post-I/O) modeli bulunuyor. Matematik Alanında Zirve Mücadelesi Matematik yeteneklerinin değerlendirildiği alanda, Claude 3 Opus modeli 95.19 puanla birinci sırada yer alıyor. Onu yakından takip eden GPT-4 Turbo Preview ve GPT-4o modelleri ise sırasıyla 95.10 ve 94.85 puan alarak matematik alanında güçlü rakipler olduklarını gösteriyor. Talimat Takibi Alanındaki Başarılar Talimat takibi yeteneklerinin değerlendirildiği liderlik tablosunda, GPT-4o modeli 88.57 puanla lider konumda. Onu, 87.64 puanla GPT-4 Turbo Preview ve 85.55 puanla Llama 3 70B Instruct izliyor. Bu modeller, verilen talimatları doğru ve etkili bir şekilde takip edebildiklerini kanıtlıyor. İspanyolca Dil Yeteneği Değerlendirmesi İspanyolca dil yeteneği değerlendirmesinde, GPT-4o modeli 1139 puanla birinci sırada yer alıyor. Gemini 1.5 Pro (Post-I/O) ve GPT-4 Turbo Preview modelleri ise sırasıyla 1129 ve 1088 puanla onu takip ediyor. Scale AI Kimdir? Scale AI, yapay zeka ve makine öğrenimi projelerine veri işleme ve yönetme çözümleri sunan bir teknoloji şirketidir. 2016 yılında kurulan şirket, başta veri etiketleme hizmetleri sunarak ün kazanmış ve zamanla çeşitli sektörlerdeki müşterilerine hizmet vermeye başlamıştır. SEAL Leaderboards hakkında daha fazla bilgi almak linki ziyaret edebilirsiniz.

    -

    3 Haziran 2024
  • Anthropic Araştırma
    AI Etik / AI Trendleri

    Anthropic Araştırması Claude Sonnet'in İç Dünyası

    Anthropic Araştırma Ekibi, Claude Sonnet isimli büyük dil modelinin içinde milyonlarca kavramın nasıl temsil edildiğini belirlediğini duyurdu. Yapay zeka modellerinin iç işleyişini anlama konusunda önemli bir ilerleme anlamına gelen araştırma gelecekte yapay zeka modellerini daha güvenli hale getirmede önemli bir rol oynayabilir.

    -

    23 Mayıs 2024
  • Openai-scarlett-Johansson
    AI Etik / AI Trendleri

    OpenAI Scarlett Johansson 'a Benzeyen ChatGPT Sesini Kaldırıyor

    OpenAI ve Scarlett Johansson Krizi Yapay Zeka Ses Klonlama ve Etik Tartışmalar. Scarlett Johansson OpenAI’ın yeni ChatGPT-4o modelinde kullanılan sesin, kendi sesine "ürkütücü derecede benzer" olduğunu iddia ederek sert bir çıkış yaptı. Bu durum, OpenAI'ın bu ses modelini geri çekmesine neden oldu.

    -

    21 Mayıs 2024

AiTrends'e Katıl!


Bize Katılın, İçeriklerinizi ve Haberlerinizi Bizimle Paylaşın!

Image