Categories: Teknoloji

OpenAI’nin yeni o1 modelinin bir dezavantajlı çıktı

OpenAI, cevap vermeden önce daha fazla düşünmek için tasarlanmış yeni bir yapay zeka modeli serisinin ilki olan o1’i tanıttı.

Yeni model, karmaşık görevleri çözebiliyor. Ayrıca önceki modellere kıyasla bilim, kodlama ve matematik gibi alanlarda daha zorlu problemleri aştığı söyleniyor. Temelde, mevcut yapay zeka sohbet botlarına göre insanlara biraz daha fazla benzer şekilde düşünüyor.

OpenAI’nin önceki modelleri, standart sınavlarda başarı sağlarken, şirket o1’in bir adım daha ileri gittiğine dikkat çekti. Fizik, kimya ve biyoloji gibi zorlu sınavlarda doktora öğrencilerine benzer performans gösterdiği ifade ediliyor.

Örneğin o1, OpenAI’nin mayıs ayında tanıttığı çok modlu model olan GPT-4o’yu Uluslararası Matematik Olimpiyatı’nın elemelerinde açık ara farkla geçti. GPT-4o sınavdaki soruların yalnızca yüzde 13’ünü doğru çözerken, o1 yüzde 83’lük bir başarıya ulaştı.

O1’in akıl yürütme yeteneklerindeki bu artışın, düşünce zinciri olarak bilinen bir yönlendirme tekniğinden kaynaklandığı belirtiliyor.

OpenAI, o1’in hatalarını tanımayı ve düzeltmeyi öğrendiğini, zor adımları daha basit adımlara ayırmayı bildiğini, mevcut yöntem işe yaramadığında farklı bir yaklaşım denemeyi öğrendiğini belirtiyor.

OpenAI’nin yeni o1’inin bir dezavantajı var

OpenAI, insan test kullanıcılarının, veri analizi, kodlama ve matematik gibi akıl yürütmeye dayalı kategorilerde o1’in yanıtlarını tercih ettiğini, ancak GPT-4o’nun kişisel yazım gibi doğal dil görevlerinde hala üstün olduğunu kaydetti. Bu da onu kardeşi GPT-4o’ya göre biraz da olsa dezavantajlı hale getiriyor.

OpenAI’nin ana misyonu uzun zamandır yapay genel zekâ (AGI) oluşturmak. AGI, insan yeteneklerini taklit eden hala teorik bir yapay zeka biçimi.

Yaz aylarında şirket, henüz o1 tanıtılmamışken, bu hedefe ulaşma süreci içinde beş seviyeli yeni bir sınıflandırma sistemi açıkladı.

Şirket yöneticileri, o1’in ikinci seviyeye yaklaştığını ve bu seviyenin insan düzeyinde problem çözme yeteneğine sahip düşünürler olarak tanımlandığını çalışanlarına bildirmişti.

Pennsylvania Üniversitesi’nden Ethan Mollick, o1 modeline bir aydan fazla süredir erişimi olan bir kişi olarak, modelin kazanımlarının en iyi örneğinin bulmaca çözme yeteneği olduğunu söyledi.

Mollick’e göre bulmacalar genellikle büyük dil modelleri için zorlayıcı. Çünkü birbirini etkileyen birçok cevabın denenmesini ve reddedilmesini gerektiriyor. Mollick, çoğu büyük dil modelinin yanıtlarına yalnızca bir seferde bir kelime ekleyebildiğini belirtti.

Ancak Mollick, o1’den bir bulmaca çözmesini istediğinde, yanıt vermeden önce tam 108 saniye boyunca düşündüğünü söyledi. Yanıtlarının etkileyici olduğunu söylese de tamamen doğru olmadığının altını çizdi.

İkna olmayan yapay zeka uzmanları da var

New York Üniversitesi’nde bilişsel bilim profesörü olan Gary Marcus, Business Insider’a yaptığı açıklamada, modelin “tkileyici bir mühendislik çalışması olduğunu ancak büyük bir sıçrama olmadığını söyledi ve ekledi, “Her zamanki gibi göklere çıkarılacağına eminim, ancak AGI’ye yakın değil.”

OpenAI, geçen yıl GPT-4’ü tanıttığından beri AGI’yi icat etme arayışında ardışık güncellemeler yayınlıyor. Nisan ayında, GPT-4 Turbo, ücretli abonelere sunuldu. Bu güncelleme, daha sohbet tarzında yanıtlar üretme yeteneği içeriyordu.

Şirket, temmuz ayında sınırlı bir kullanıcı grubuyla SearchGPT adlı bir yapay zeka arama ürününü test ettiğini duyurdu.

Kaynak: HABER MERKEZİ

Deniz Temur

Next Liverpool'dan Arda Güler'e 70 milyon euro »

Previous « AB’den İran’a yeni yaptırım sinyali

Altın ve petrol füze saldırısı sonrasında yükseldi

İran'ın İsrail'e füze saldırısı sonrası petrol ve altın fiyatları yönünü yukarı çevirdi. Saldırı sonrası Brent…

7 dakika ago

Gündem

Mehmed Fetihler Sultanı 18.bölüm fragmanı heyecanlandırdı

TRT'nin kadrosuyla ve konusuyla iddialı dizisi Mehmed Fetihler Sultanı 18.bölüm fragmanı yayınlandı mı araştırılıyor. Mehmed…

7 dakika ago

Yaşam

Deniz Uğur’dan üzücü haber: Kanser yeniden nüksetti!

Son dönemde Reha Muhtar ve şarkıcı Nilüfer ile yaşadığı sorunlar nedeniyle gündemde olan oyuncu Deniz…

19 dakika ago

Gündem

Bahar dizisi 19.bölüm fragmanı: Bahar’ın 8 Ekim’de yayınlanacak olan yeni bölümünde neler olacak?

Show TV'nin sevilen dizisi Bahar dizisi 19.yeni bölüm fragmanı yayınlandı mı merak ediliyor. Bahar'ın yeni…

24 dakika ago

Gündem

2025 Ocak ayı sosyal yardım zammı belli oldu: Evde bakım, 65 yaş, engelli dul ve yetim maaşına yüzde 9.31 zam gelecek

Ocak 2025 sosyal yardım zammı belli oldu. Evde bakım maaşı, 65 yaş aylığı, engelli maaşı…

38 dakika ago

Teknoloji

Apple, iPhone 17’de kuralları yıkıyor: Eylem ve ses tuşları artık tek bir yerde olacak!

Apple’ın iPhone 16 serisini tanıtmasının üzerinden henüz kısa bir süre geçmesine rağmen, iPhone 17 ile…

41 dakika ago