OpenAI’nin yeni o1 modelinin bir dezavantajlı çıktı

OpenAI, karmaşık görevlerde daha fazla düşünebilen ve bilim, matematik gibi alanlarda zor problemleri çözebilen yeni o1 modelini tanıttı.
o1, Uluslararası Matematik Olimpiyatı’nda GPT-4o’yu geride bırakarak yüzde 83 başarı sağladı ve insan zekâsına daha yakın performans sergiledi. Ancak, GPT-4o ile karşılaştırıldığında öne çıkan bir dezavantajı olduğu söyleniyor.

Teknoloji

Yayınlama: 13.09.2024

A⁺

A^-

OpenAI, cevap vermeden önce daha fazla düşünmek için tasarlanmış yeni bir yapay zeka modeli serisinin ilki olan o1’i tanıttı.

Yeni model, karmaşık görevleri çözebiliyor. Ayrıca önceki modellere kıyasla bilim, kodlama ve matematik gibi alanlarda daha zorlu problemleri aştığı söyleniyor. Temelde, mevcut yapay zeka sohbet botlarına göre insanlara biraz daha fazla benzer şekilde düşünüyor.

OpenAI’nin önceki modelleri, standart sınavlarda başarı sağlarken, şirket o1’in bir adım daha ileri gittiğine dikkat çekti. Fizik, kimya ve biyoloji gibi zorlu sınavlarda doktora öğrencilerine benzer performans gösterdiği ifade ediliyor.

Örneğin o1, OpenAI’nin mayıs ayında tanıttığı çok modlu model olan GPT-4o’yu Uluslararası Matematik Olimpiyatı’nın elemelerinde açık ara farkla geçti. GPT-4o sınavdaki soruların yalnızca yüzde 13’ünü doğru çözerken, o1 yüzde 83’lük bir başarıya ulaştı.

O1’in akıl yürütme yeteneklerindeki bu artışın, düşünce zinciri olarak bilinen bir yönlendirme tekniğinden kaynaklandığı belirtiliyor.

OpenAI, o1’in hatalarını tanımayı ve düzeltmeyi öğrendiğini, zor adımları daha basit adımlara ayırmayı bildiğini, mevcut yöntem işe yaramadığında farklı bir yaklaşım denemeyi öğrendiğini belirtiyor.

OpenAI’nin yeni o1’inin bir dezavantajı var

OpenAI, insan test kullanıcılarının, veri analizi, kodlama ve matematik gibi akıl yürütmeye dayalı kategorilerde o1’in yanıtlarını tercih ettiğini, ancak GPT-4o’nun kişisel yazım gibi doğal dil görevlerinde hala üstün olduğunu kaydetti. Bu da onu kardeşi GPT-4o’ya göre biraz da olsa dezavantajlı hale getiriyor.

OpenAI’nin ana misyonu uzun zamandır yapay genel zekâ (AGI) oluşturmak. AGI, insan yeteneklerini taklit eden hala teorik bir yapay zeka biçimi.

Yaz aylarında şirket, henüz o1 tanıtılmamışken, bu hedefe ulaşma süreci içinde beş seviyeli yeni bir sınıflandırma sistemi açıkladı.

Şirket yöneticileri, o1’in ikinci seviyeye yaklaştığını ve bu seviyenin insan düzeyinde problem çözme yeteneğine sahip düşünürler olarak tanımlandığını çalışanlarına bildirmişti.

Pennsylvania Üniversitesi’nden Ethan Mollick, o1 modeline bir aydan fazla süredir erişimi olan bir kişi olarak, modelin kazanımlarının en iyi örneğinin bulmaca çözme yeteneği olduğunu söyledi.

Mollick’e göre bulmacalar genellikle büyük dil modelleri için zorlayıcı. Çünkü birbirini etkileyen birçok cevabın denenmesini ve reddedilmesini gerektiriyor. Mollick, çoğu büyük dil modelinin yanıtlarına yalnızca bir seferde bir kelime ekleyebildiğini belirtti.

Ancak Mollick, o1’den bir bulmaca çözmesini istediğinde, yanıt vermeden önce tam 108 saniye boyunca düşündüğünü söyledi. Yanıtlarının etkileyici olduğunu söylese de tamamen doğru olmadığının altını çizdi.

İkna olmayan yapay zeka uzmanları da var

New York Üniversitesi’nde bilişsel bilim profesörü olan Gary Marcus, Business Insider’a yaptığı açıklamada, modelin “tkileyici bir mühendislik çalışması olduğunu ancak büyük bir sıçrama olmadığını söyledi ve ekledi, “Her zamanki gibi göklere çıkarılacağına eminim, ancak AGI’ye yakın değil.”

OpenAI, geçen yıl GPT-4’ü tanıttığından beri AGI’yi icat etme arayışında ardışık güncellemeler yayınlıyor. Nisan ayında, GPT-4 Turbo, ücretli abonelere sunuldu. Bu güncelleme, daha sohbet tarzında yanıtlar üretme yeteneği içeriyordu.

Şirket, temmuz ayında sınırlı bir kullanıcı grubuyla SearchGPT adlı bir yapay zeka arama ürününü test ettiğini duyurdu.

Kaynak: HABER MERKEZİ

OpenAI

Benzer Konular

Teknolojide ‘siber harp’ tehlikesi: “Bu bir ulusal güvenlik sorunudur”

Bilişim Uzmanı Hakan Topuzoğlu, "Cihazların da yazılımının bir arka kapısı var. Malum devrelerden oluştuğu için ve bu çipler üzerinde de uzaktan müdahale mümkün olduğu için güncellemeler yapılabilmesi amacıyla böyle bir şey aslında mümkün. Tabii ki bunu başka bir devletin yapıp yapmadığını ispat etmek de çok kolay değil ama bizim burada...

İsrail’in siber saldırısı sonrası gündemde: Çağrı cihazı nedir, nasıl çalışır?

İsrail Lübnan Hizbullah'a siber saldırı düzenledi. Saldırıda binlerce kişi yaralanırken, saldırının çağrı cihazları aracılığıyla yapılmış olması gündeme bomba gibi düştü. Peki çağrı cihazı nedir, nasıl çalışır, İsrail çağrı cihazlarını nasıl bir bomba gibi kullandı? İşte yanıtları...

Bir antitröst davası da META’ya!

Meta’nın, sınıflandırılmış reklam uygulamaları nedeniyle AB'de ağır bir antitröst cezasıyla karşı karşıya kalacağı bildirildi.

Instagram’a yaş sınırlaması geldi

Instagram, uzun zamandır tartışmalara neden olan yaş sınırlaması için ilk adımı attı. Buna göre; 18 yaş altı kullanıcılar için yeni kısıtlamalar gelirken, reşit olmayan kullanıcıların erişimi ve etkileşimleri sınırlandırıldı.

Mersin’de TEKNOFEST heyecanı: ‘İnsansız Su Altı Sistemleri Yarışması’ başladı

Mersin'de, TEKNOFEST kapsamında düzenlenen İnsansız Su Altı Sistemleri Yarışması başladı. Mersin Olimpik Yüzme Havuzunda 17-20 Eylül arasında gerçekleştirilecek yarışmada 45 takım mücadele ediyor.

Teknofest Adana ne zaman? Teknofest Adana ziyaret tarihleri ve saatleri açıklandı

50 ana kategori ve 127 alt kategoride düzenlenen TEKNOFEST Akdeniz Teknoloji Yarışmalarına bu yıl başvuru yapan 790 bin takım ve 1 milyon 650 binden fazla yarışmacı en iyisi olmak için mücadele ediyor. Yarışmalarda dereceye giren takımlara 30 milyon TL ödül ve 55 milyon TL’nin üzerinde malzeme desteği sağlanacak. Peki, Teknofest...

Bir Yorum Yazın

[ Yoruma cevap yazmaktan vazgeç ]

Ziyaretçi Yorumları - 0 Yorum

Henüz yorum yapılmamış.

GÜNCEL KONULAR

Teknolojide ‘siber harp’ tehlikesi: “Bu bir ulusal güvenlik sorunudur”

İsrail’in siber saldırısı sonrası gündemde: Çağrı cihazı nedir, nasıl çalışır?

Bir antitröst davası da META’ya!

Meta’nın, sınıflandırılmış reklam uygulamaları nedeniyle AB'de ağır bir antitröst cezasıyla karşı karşıya kalacağı bildirildi.

Instagram’a yaş sınırlaması geldi

Mersin’de TEKNOFEST heyecanı: ‘İnsansız Su Altı Sistemleri Yarışması’ başladı

Teknofest Adana ne zaman? Teknofest Adana ziyaret tarihleri ve saatleri açıklandı

iPhone kullanıcılarının beklediği tarih belli oldu: iOS 18 güncellemesi ne zaman, saat kaçta yayınlanacak?

iOS 18 güncellemesi ne zaman, saat kaçta yayınlanacak? Milyonlarca iPhone kullanıcısının merakla bekledi iOS 18 güncellemesi için geri sayım başladı. iPhone 16 ile birlikte tanıtılan iOS 18, yepyeni özellikleri ve özelleştirmeleriyle birlikte Apple kullanıcılarına sunulacak.

Sanayi ve Teknoloji Bakanlığı, Özdemir’in ‘yapay zeka’ sorusunu yanıtladı

Milliyetçi Hareket Partisi Genel Başkan Yardımcısı ve Kayseri Milletvekili İsmail Özdemir, Sanayi ve Teknoloji Bakanı Mehmet Fatih Kacır’a Türkiye’de kamu kurum ve kuruluşlarında yapay zeka teknolojisinin kullanımına ilişkin yazılı soru önergesi verdi. Bakanlık, 6 bakanlığın yapay zeka kullandığını ve TÜBİTAK projelerinde yapay zekadan faydalanıldığı yanıtını verdi.

Adana’da düzenlenecek TEKNOFEST etkinliği için ziyaretçi kayıtları başladı!

Türkiye'nin teknoloji ve inovasyon ekosisteminin en büyük buluşması olan TEKNOFEST, bu yıl ilk kez Adana'da düzenlenecek! Her yaştan teknoloji tutkununu bir araya getirecek olan festivale katılmak için kayıtlar başladı.

Ulaştırma ve Altyapı Bakanı Uraloğlu’ndan Instagram açıklaması

Ulaştırma ve Altyapı Bakanı Abdulkadir Uraloğlu, "Instagram'a erişim engeli getirdik. Gerçekten 9 gün ne kaybettik? Ya da kim ne zarar gördü? Elbette zarar gören bazı insanlarımız, ticaretle uğraşanlar olmuştu ama orayı gerçekten doğru kullanmamız lazım. Biz asla yasakçı bir zihniyet içerisinde değiliz ama ülkemizin, toplumumuzun hassasiyetleri, kanunları, kuralları var. Onları...