OpenAI, cevap vermeden önce daha fazla düşünmek için tasarlanmış yeni bir yapay zeka modeli serisinin ilki olan o1’i tanıttı.
Yeni model, karmaşık görevleri çözebiliyor. Ayrıca önceki modellere kıyasla bilim, kodlama ve matematik gibi alanlarda daha zorlu problemleri aştığı söyleniyor. Temelde, mevcut yapay zeka sohbet botlarına göre insanlara biraz daha fazla benzer şekilde düşünüyor.
OpenAI’nin önceki modelleri, standart sınavlarda başarı sağlarken, şirket o1’in bir adım daha ileri gittiğine dikkat çekti. Fizik, kimya ve biyoloji gibi zorlu sınavlarda doktora öğrencilerine benzer performans gösterdiği ifade ediliyor.
Örneğin o1, OpenAI’nin mayıs ayında tanıttığı çok modlu model olan GPT-4o’yu Uluslararası Matematik Olimpiyatı’nın elemelerinde açık ara farkla geçti. GPT-4o sınavdaki soruların yalnızca yüzde 13’ünü doğru çözerken, o1 yüzde 83’lük bir başarıya ulaştı.
O1’in akıl yürütme yeteneklerindeki bu artışın, düşünce zinciri olarak bilinen bir yönlendirme tekniğinden kaynaklandığı belirtiliyor.
OpenAI, o1’in hatalarını tanımayı ve düzeltmeyi öğrendiğini, zor adımları daha basit adımlara ayırmayı bildiğini, mevcut yöntem işe yaramadığında farklı bir yaklaşım denemeyi öğrendiğini belirtiyor.
OpenAI, insan test kullanıcılarının, veri analizi, kodlama ve matematik gibi akıl yürütmeye dayalı kategorilerde o1’in yanıtlarını tercih ettiğini, ancak GPT-4o’nun kişisel yazım gibi doğal dil görevlerinde hala üstün olduğunu kaydetti. Bu da onu kardeşi GPT-4o’ya göre biraz da olsa dezavantajlı hale getiriyor.
OpenAI’nin ana misyonu uzun zamandır yapay genel zekâ (AGI) oluşturmak. AGI, insan yeteneklerini taklit eden hala teorik bir yapay zeka biçimi.
Yaz aylarında şirket, henüz o1 tanıtılmamışken, bu hedefe ulaşma süreci içinde beş seviyeli yeni bir sınıflandırma sistemi açıkladı.
Şirket yöneticileri, o1’in ikinci seviyeye yaklaştığını ve bu seviyenin insan düzeyinde problem çözme yeteneğine sahip düşünürler olarak tanımlandığını çalışanlarına bildirmişti.
Pennsylvania Üniversitesi’nden Ethan Mollick, o1 modeline bir aydan fazla süredir erişimi olan bir kişi olarak, modelin kazanımlarının en iyi örneğinin bulmaca çözme yeteneği olduğunu söyledi.
Mollick’e göre bulmacalar genellikle büyük dil modelleri için zorlayıcı. Çünkü birbirini etkileyen birçok cevabın denenmesini ve reddedilmesini gerektiriyor. Mollick, çoğu büyük dil modelinin yanıtlarına yalnızca bir seferde bir kelime ekleyebildiğini belirtti.
Ancak Mollick, o1’den bir bulmaca çözmesini istediğinde, yanıt vermeden önce tam 108 saniye boyunca düşündüğünü söyledi. Yanıtlarının etkileyici olduğunu söylese de tamamen doğru olmadığının altını çizdi.
New York Üniversitesi’nde bilişsel bilim profesörü olan Gary Marcus, Business Insider’a yaptığı açıklamada, modelin “tkileyici bir mühendislik çalışması olduğunu ancak büyük bir sıçrama olmadığını söyledi ve ekledi, “Her zamanki gibi göklere çıkarılacağına eminim, ancak AGI’ye yakın değil.”
OpenAI, geçen yıl GPT-4’ü tanıttığından beri AGI’yi icat etme arayışında ardışık güncellemeler yayınlıyor. Nisan ayında, GPT-4 Turbo, ücretli abonelere sunuldu. Bu güncelleme, daha sohbet tarzında yanıtlar üretme yeteneği içeriyordu.
Şirket, temmuz ayında sınırlı bir kullanıcı grubuyla SearchGPT adlı bir yapay zeka arama ürününü test ettiğini duyurdu.
Kaynak: HABER MERKEZİ
İran'ın İsrail'e füze saldırısı sonrası petrol ve altın fiyatları yönünü yukarı çevirdi. Saldırı sonrası Brent…
TRT'nin kadrosuyla ve konusuyla iddialı dizisi Mehmed Fetihler Sultanı 18.bölüm fragmanı yayınlandı mı araştırılıyor. Mehmed…
Son dönemde Reha Muhtar ve şarkıcı Nilüfer ile yaşadığı sorunlar nedeniyle gündemde olan oyuncu Deniz…
Show TV'nin sevilen dizisi Bahar dizisi 19.yeni bölüm fragmanı yayınlandı mı merak ediliyor. Bahar'ın yeni…
Ocak 2025 sosyal yardım zammı belli oldu. Evde bakım maaşı, 65 yaş aylığı, engelli maaşı…
Apple’ın iPhone 16 serisini tanıtmasının üzerinden henüz kısa bir süre geçmesine rağmen, iPhone 17 ile…