Apple her ne kadar üretken YZ rüzgarına geç tutulmuş şeklinde görünse de, “bağlamsal anlayış”la ilgili yeni bir araştırma Siri’nin ChatGPT’den fazlaca daha iyi olmasını sağlayabilir.
Teknoloji devi, ChatGPT’nin yükselişi ve arkasından Google, Microsoft ve Meta şeklinde rakiplerinin üretken YZ vasıta ve özelliklerinin piyasaya çıkışı esnasında kuşku çekici şekilde sessizliğini korudu. Sadece Apple araştırmacıları, Apple fanatiklerinin beklediği türde bir üretken YZ güncellemesini Siri’ye kazandıracak yeni bir model üretmiş olabilir.
Araştırmacıların yayınladığı makalede “İnsan hitabı tipik olarak, bağlam göz önüne alındığında anlamı (öteki insanoğlu için) açık olan ‘onlar’ yada ‘şu’ şeklinde belirsiz referanslar içeriyor” deniyor. Yazı, “sesli asistanlarda gerçek anlamda naturel bir konuşma deneyimi” elde etmek amacıyla, büyük dil modellerinin (LLM’ler) ekran, konuşma ve arka plan referansları (mesela, arka planda çalışan uygulamalar yada özellikler) söz mevzusu olduğunda bağlamı devamlı anlayamaması sorununu ele alan ReALM (Dil Modellemesi Olarak Referans Çözünürlüğü) adlı bir model öneriyor.
Her ne kadar ChatGPT bazı türde bağlamları anlamada oldukça iyi olsa da, araştırmacılara gore ReALM, GPT-3.5 ve GPT-4’ten (ChatGPT’nin parasız ve ücretli versiyonlarını güçlendiren modeller) tüm bağlam testlerinde fazlaca daha yüksek performans gösteriyor. Peki bu model Siri için ne ifade ediyor, gelin bir bakalım:
1. Ekranda bağlam ipuçları
Apple araştırmacılar ReALM’i ekranda görünen web sayfaları, şahıs detayları şeklinde içeriklerle eğitti. Bu sayede model, ekran görüntülerindeki metinleri (mesela adresler ve banka hesap detayları şeklinde) anlama kabiliyeti kazanmıştır. Her ne kadar GPT-4 de görselleri anlıyor olsa da, model ekran görüntüleriyle eğitilmiş değil. Makaleye gore ReALM, Apple kullanıcılarının Siri’ye sorabileceği ekrandaki detayları anlama mevzusunda daha başarı göstermiş.
2. Konuşma ve arka plan anlayabilme
Konuşmaya dayalı referanslar, konuşmayla ilgili olan, sadece istemde açıkça belirtilmemiş olabilecek bir şey anlamına geliyor. ReALM’i işletme listeleri şeklinde verilerle eğitmekle model, “en alttakini ara” şeklinde ekranda görüntülenen yakındaki eczanelerden en alttakini arayabiliyor. Normalde bunun için “Listelenen eczanelerden en alttakini ara” şeklinde daha nokta atışı bir istemde bulunmak gerekiyor.
ReALM bunun haricinde “arka plandaki durumları” da algılayabiliyor. Şu demek oluyor ki kullanıcının o anda ekranda görmediği ya da etkileşime girmediği özellikler de ReALM’in kapsamında olabiliyor. Şu demek oluyor ki siz arkadaşınızla Whatsapp’ta konuşurken, YZ asistanınız arkada çalan şarkı ya da çalan alarmın da bilincinde oluyor ve bunlara müdahale edebiliyor.
3. Tamamen cihazınızda bulunacak
Büyük dil modelleri (LLM’ler) çoğu zaman fazlaca fazla işlem gücü istediği için, çoğunlukla bulut tabanlı olarak çalışıyorlar. Sadece ReALM tasarlanırken, sizin cihazınız üstünde emek harcaması düşünülerek tasarlanmış. ReALM aslına bakarsak daha minik bir LLM, bir tek “bilhassa ve bir tek referans çözümleme görevi için ayarlanmış”. Apple sattığı cihazlarda gizliliğe verdiği öneme büyük vurgu yapıyor. Hal bu şekilde olunca Siri’nin üretken YZ versiyonunun da aygıt üstünde çalışıyor olması da markanın vizyonuna uygun görünüyor. Bununla beraber YZ kabiliyetlerine haiz cihazlar için de büyük bir çağ atlanmış olacak.
Apple, YZ planları hakkında hep ağzını sıkı tutuyor. Sadece firmanın CEO’su Tim Cook daha ilkin yapmış olduğu bir açıklamada 2024 yılı sonuna doğru bir büyük YZ duyurusu yapacaklarını söylemişti. Bu yüzden tüm gözler Apple’ın 10 Haziran’da düzenleyeceği WWDC 2024 etkinliğinde olacak.
Cecily Mauran’ın haberini Özgür Yıldız Türkçeleştirdi.