hamburger-icon
logo
mobile-hourSon Dakika
  • Son Dakika
  • Türkiye
  • Video
    • Yayın Akışı
    • Programlar
    • Ekran Yüzleri
    • Canlı Yayın
    • Frekanslar
  • Finans
  • Dünya
    • Türkiye
    • Ekonomi
    • Magazin
    • Spor
    • Teknoloji
    • Otomobil
  • Ekonomi
  • Spor
  • Magazin
  • Yaşam
  • Resmi İlanlar
    • Yayın Akışı
    • Programlar
    • Ekran Yüzleri
    • Canlı Yayın
    • Frekanslar
desktop-gifmobile-gifCanlı YayınGiriş

HABERLER

  • Canlı Yayın
  • Son Dakika
  • Son Dakika Depremler
  • Türkiye
  • Dünya
  • Finans
  • Spor
  • Ekonomi
  • Sağlık
  • Magazin
  • Seyahat
  • Yaşam
  • Otomobil
  • Teknoloji
  • Eğitim
  • Kültür Sanat
  • Yerel Haberler

KATEGORİLER

  • Yazarlar
  • Hava Durumu
  • Video
  • Foto Haber
  • Döviz
  • Altın
  • Koronavirüs
  • Astroloji
  • CNN Life

TV PROGRAMLARI

  • A'dan Z'ye
  • Güne Merhaba
  • Gundem
  • Bugün
  • Günlük
  • Ana Haber
  • Programlar
  • Canlı Yayınwatch
  • Yayın Akışı
  • Ekran Yüzleri
  • Frekanslar

TAKİP EDİN

  • youtube
  • facebook
  • x
  • instagram
  • tiktok

UYGULAMAYI İNDİRİN

  • google-play
  • app-store
  • app-gallery
hourSON DAKİKA
left-arrowright-arrow
weather
İstanbul
down-arrowup-arrow
    • Anasayfa
    • Ekonomi Haberleri

    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı!

    17.06.2024 - 09:53Güncellenme Tarihi17.06.2024 - 09:53
    • facebookfacebook
    • xx
    • whatsappwhatsapp
    • down-arrowcopy
      • copyLinki Kopyala
      • plusYazıyı Büyüt
      • minusYazıyı Küçült
    google-newsgoogle-news
    flipboardflipboard

    Kâr amacı gütmeyen yapay zekâ araştırma kuruluşu LAION'daki bilim insanları dikkat çeken bir teste imza attı. Bakın en gelişmiş yapay zekalar bu basit mantık sorusuna nasıl yanıtlar verdi…

    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    Popüler yapay zekâ (YZ) modelleri, üretici şirketlerin sık sık vurguladığı gibi gerçekten ‘ileri düzeyde’ mi? Bulgular, bu konuda şüpheleri beraberinde getiriyor.
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    Mashable Türkiye'de yer alan habere göre, Henüz hakem değerlendirmesinden geçmemiş olan makale, yapay zekâyı şaşırtan soruyu ‘Alice Harikalar Diyarında’ kısaca AIW problemi olarak adlandırıyor.
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    Araştırmacılar problemin birkaç farklı versiyonunu kullandı. Örneğin X ve Y sayısı veya birkaç talep daha içerecek şekilde istem dili değiştirildi. Ama problemi çözmek için gereken temel muhakeme süreci aynı kaldı. Bu basit mantık sorusu şöyle:
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    Alice'in [X] erkek kardeşi var ve ayrıca [Y] kız kardeşi var. Alice'in erkek kardeşinin kaç kız kardeşi vardır?
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    YANIT: Alice'in kaç kız kardeşi varsa + Alice'in kendisi. Yani Alice'in üç erkek ve bir kız kardeşi varsa her erkek kardeşin iki kız kardeşi olacaktır. Gördüğünüz üzere gayet basit bir soru.
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    Ancak araştırmacılar soruyu önde gelen tüm yapay zekâ modellerinde, yani;
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom

    OpenAI’ın GPT-3, GPT-4 ve GPT-4o Anthropic'in Claude 3 Opus Google’ın Gemini Meta'nın Llama Mistral AI'nin Mextral Mosaic'in Dbrx Ve Cohere’in Command R+ modelinde test etti.

    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    Sonuç olarak, modellerin neredeyse hepsi sınıfta kaldı. Sadece GPT-4o standart okul puanlarına göre teknik olarak ‘geçer’ diyebileceğimiz bir not aldı. Ve sorun temel yanlışlıkların da ötesine geçti: YZ modelleri hiçbir anlam ifade etmeyen tuhaf ve hatalı çözüm yollarını detaylandırdı. İşin daha da ilginç tarafı sonucun hatalı olduğu söylendiğinde yapılan yanlış ikiye katlandı.
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    Araştırmalarında insanlar tarafından kolayca çözülebilen ve basit bir şekilde formüle edilmiş problemi kullanan LAOIN ekibine göre, bu durum ‘geniş ölçeklerde eğitilen son teknoloji modellerin işlev ve muhakeme yeteneklerinde çarpıcı bir sorunu’ gözler önüne seriyor. Ekibin bulgulara ilişkin makalesinde, “Modellerin net bir şekilde yanlış olan yanıtların akla yatkın görünmesini sağlamak için konfabülasyonu andıran anlamsız bir ‘akıl yürütme’ biçimi sunması nedeniyle ortaya çıkan tablo dramatik” ifadeleri yer alıyor. (Bakalım konfabülasyon YZ jargonunda yapay zekânın en büyük sıkıntısını yansıtan halüsinasyonun pabucunu dama atacak mı? )
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    Araştırma, AIW probleminin farklı varyasyonlarını eline yüzüne bulaştıran YZ modellerinden gelen düzinelerce örnek içeriyor. Meta'nın Llama 3'ü ile yapılan ve AIW sorusunun en basit versiyonunun sorulduğu şu örneği ele alalım.
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom

    SORU: Alice’in dört erkek kardeşi ve bir de kız kardeşi var. Alice'in erkek kardeşinin kaç kız kardeşi var? YANIT: Klasik bir yanal düşünme bulmacası! Hadi başlayalım: Alice'in dört erkek kardeşi var. Alice'in bir de kız kardeşi (kendisi) var. Yani, Alice'in erkek kardeşlerinin her birinin bir kız kardeşi var, o da Alice'in kendisi! Dolayısıyla cevap şu: Alice’in erkek kardeşlerinin her birinin bir kız kardeşi var. Gördüğünüz gibi Llama kendinden aşırı emin ama maalesef verdiği yanıt doğru değil. Sorunun cevabı elbette iki kız kardeş.

    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom

    Şimdi de sorunun daha karmaşık bir versiyonuna örnek olarak Claude 3 Opus ile olan teste bakalım. SORU: Alice’in 4 kız kardeşi ve ayrıca 1 erkek kardeşi var. Alice'in erkek kardeşinin kaç kız kardeşi var? Bu soruya cevap vermeden önce dikkatlice düşün ve doğru çözüme gidiş yolunu herhangi bir hata olmaması için iki kez kontrol et. YANIT: Bu problemi adım adım çözelim: 1. Alice'in dört kız ve bir erkek kardeşi var. 2. Alice'in erkek kardeşi Alice ile aynı aileden. 3. Alice'in tüm kız kardeşleri aynı zamanda erkek kardeşinin de kız kardeşi. 4. Dolayısıyla Alice'in erkek kardeşinin de Alice ile aynı sayıda kız kardeşi var, yani dört. İki kez kontrol ettim ve herhangi bir hata bulamadım. Cevap: Alice'in erkek kardeşinin dört kız kardeşi var. Model iki kez kontrol ettiğini belirtmiş ama yanıt yine yanlış. Doğru cevap tabii ki beş kız kardeş olmalıydı.

    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    Epey dikkat çeken bir başka nokta ise bulguların, YZ modellerinin etkinliğini ölçmek için kullanılan endüstri kriterleriyle (yani standart hâline gelmiş test sonuçlarıyla) arasındaki büyük fark. Araştırmaya göre YZ modellerinin karnesi şöyle:OpenAI’ın yeni GPT-4o modeli AIW sorusunu yüzde 65 oranında doğru yanıtlayarak en yüksek başarıyı elde etti.Onu yüzde 43 başarı oranıyla Claude 3 Opus takip etti.Meta’nın en başarılı olan Llama modeli Llama 2-7b yüzde 30'da kaldı. (Araştırmacılar birkaç Llama modelini test etti.)Google'ın Gemini Pro'su yüzde 0,8 ile fena hâlde düşük bir performans gösterdi.Araştırmacılar YZ'nin problem çözme kapasitesini değerlendirmek için tasarlanan ve MMLU adı verilen bir teste özellikle dikkat çekiyor. GPT-4o, Claude 3 Opus, Llama 2-7b ve Gemini Pro, MMLU testinden sırasıyla yüzde 88, yüzde 87, yüzde 64 ve yüzde 72 puan aldı. Bunlar AIW sonuçlarında elde edilenlerden hayli farklı sonuçlar. Bu nedenle bilim insanlarına göre dil modellerinin problem çözme becerilerini değerlendirdiğimiz süreçleri yeniden gözden geçirmemizde fayda var.
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom

    Makalede bu konuya dikkat çeken kısımda, “Test edilen tüm modeller, mantık yürütme işlevini test ettiğini iddia eden çeşitli standart yöntemlerde yüksek puanlar alıyor. Ancak gözlemlerimiz bu testlerin söz konusu modellerin düzeyini doğru yansıtmadığını gösteriyor” denildi.

    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom

    YZ modellerinin sürekli övülen kabiliyetlerini sorgulayan başkaları da var. Mesela MIT'de doktora adayı olan Eric Martínez, OpenAI’ın ‘GPT-4 modelinin baro sınavında ilk yüzde 10’a girdiği’ yönündeki iddiasını sorgulayan uzunca bir makale yayınladı. Martínez'in analizine göre GPT-4'ün puanı yüzde 69 yüzdelik dilimin altında kaldı. Makalesinde değerlendirme sürecindeki bariz eksikliklere dikkat çeken Martínez, OpenAI’ın yazılı kompozisyon puanlarını derecelendirmek için ulusal baro yönergelerini kullanmadığını, bunun yerine YZ modelinin sonuçlarını Maryland'deki hukuk öğrencilerinin bazı ‘iyi’ puanlarıyla karşılaştırdığını tespit etti.

    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    LAOIN ekibinin bu yeni makalesi henüz hakem değerlendirmesinden geçmedi. Buna rağmen, YZ modellerinin nasıl test edildiği, değerlendirildiği ve elbette pazarlandığı hakkında bazı önemli soruları gündeme getiriyor.
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    Haberin Devamıadv-arrow
    /
    Bu soru karşısında en gelişmiş yapay zekalar bile sınıfta kaldı
    • facebookFacebook'da Paylaş
    • xTwitter'da Paylaş
    • whatsappWhatsapp'da Paylaş
    zoom
    • LAION
    • yapay zeka
    • yapay zeka testi

    HABERLER

    • Canlı Yayın
    • Son Dakika
    • Son Depremler
    • CNN Türk Finans
    • Türkiye
    • Dünya
    • Spor
    • Ekonomi
    • Sağlık
    • Magazin
    • Seyahat
    • Yaşam
    • Otomobil
    • Teknoloji
    • Eğitim
    • Kültür Sanat
    • Yerel Haberler

    KATEGORİLER

    • Yazarlar
    • Hava Durumu
    • Video
    • Foto Haber
    • Döviz
    • Altın
    • Astroloji
    • Namaz Vakitleri
    • Ramazan
    • Yemek Tarifleri
    • Rüya Tabirleri
    • Sosyal Medya
    • Oyun
    • Ajanda

    TV PROGRAMLARI

    • A'dan Z'ye
    • Gün Ortası
    • Gündem
    • Bugün
    • Günlük
    • Ana Haber
    • Programlar
    • Canlı Yayın
    • Yayın Akışı
    • Ekran Yüzleri
    • Frekanslar

    Whatsapp İhbar hattı

    0530 918 69 18

    Google PlayApp Store
    • Yasal Uyarı
    • Kullanım ve Gizlilik
    • Künye
    • İnsan Kaynakları
    • Kişisel Verilerin Korunması
    • İzleyici Temsilcisi
    • Bize Ulaşın
    • CNN Us
    • CNN Int
    • İspanyolca
    • Arapça
    • Japonca

    Takip Edin

    • Kanal D
    • TEVE2
    • DREAM TV
    • D-Smart
    • CNN TÜRK Radyo
    • Radyo D
    ilk bilen siz olun

    Demirören Tv Holding A.Ş. - CNN ™ CNN Inc. A WarnerMedia Company. All Rights Reserved.