Popüler yapay zekâ GPT-4, lise testlerini ve hukuk fakültesi sınavlarını yüzde 90’lık dilimde yer alan puanlarla geçebiliyor ve önceki versiyonla mümkün olmayan birçok yeni işleme yeteneklerine sahip bir şekilde dün akşam saatlerinde kullanıcıları (Premium) ile buluştu.
GPT-4’ün test sonuçlarından elde edilen rakamlara bakıldığında, karşımızda “çok daha incelikli talimatları” daha yaratıcı ve güvenilir bir şekilde ele almanın yanı sıra görüntü, ses ve video girdilerini de metne dönüştürebilen bir yapay zekanın olduğu görülüyor.
OpenAI, yaptığı sunuda “Simüle edilmiş bir baro sınavını, sınava girenlerin ilk yüzde 10’u civarında bir puanla geçiyor,” diye oldukça etkileyici bir veriyi de kullanıcılarına sundu.
Exam results of GPT-4 and GPT-3.5 on a range of recent U.S. exams. Source: OpenAI
GPT4’ün puanı, onu uluslararası sıralamada ilk 20’deki bir hukuk fakültesine kabul edilmek için iyi bir konuma getiriyor. Diğer taraftan Harvard, Stanford, Princeton veya Yale gibi prestijli okullara kabul için gerekli olduğu bildirilen puanlardan sadece birkaç puanı eksik.
GPT-4 ayrıca, yeni mezun hukuk öğrencilerinin girdiği ve ABD’nin herhangi bir yargı bölgesinde avukatlık yapmalarına izin veren bir sınav olan Uniform Bar Exam’da 400 üzerinden 298 puan almayı başardı.
UBE scores needed to be admitted to practice law in each U.S. jurisdiction. Source: National Conference of Bar Examiners
ChatGPT’nin eski versiyonunun bu testte zorlandığını ve 400 üzerinden 213 puanla son yüzde 10’da kaldığını belirtmekte fayda var.
Exam results of GPT-4 and GPT-3.5 on a range of recent U.S. exams. Source: OpenAI
Ancak AP Calculus puanı oldukça ortalamaydı ve 43. ila 59. yüzdelik dilimler arasında yer aldı.
GPT-4’ün eksik olduğu bir diğer alan da İngiliz edebiyatı sınavlarıydı ve iki ayrı testte 8 ila 44. yüzdelik dilimlerde puanlar yayınladı.
OpenAI, GPT-4 ve GPT-3.5’in bu testleri 2022-2023 deneme sınavlarından aldığını ve dil işleme araçları tarafından “özel bir eğitim” alınmadığını söyledi:
“We did no specific training for these exams. A minority of the problems in the exams were seen by the model during training, but we believe the results to be representative.”
İlginç bir şekilde FactoryDAO’nun kurucusu Nick Almond, 14 Mart’ta 14.300 Twitter takipçisine GPT4’ün “insanları korkutacağını” ve küresel eğitim sistemini “çökerteceğini” söyledi.
Assessment theory was a big chunk of my life for several years. I was banging on about this day coming many years ago. I literally sounded like the resident crank at the time.
But… really this means that anything but invigilated assessment is over from this point on.
— drnick ️² (@DrNickA) March 14, 2023
GPT-4 kripto dünyasında da ses getirdi
Eski Coinbase yöneticisi Conor Grogan, GPT-4’e canlı bir Ethereum akıllı sözleşmesi eklediğini ve sohbet botunun anında birkaç “güvenlik açığına” işaret ettiğini ve kodun nasıl istismar edilebileceğini özetlediğini söyledi:
I dumped a live Ethereum contract into GPT-4.
In an instant, it highlighted a number of security vulnerabilities and pointed out surface areas where the contract could be exploited. It then verified a specific way I could exploit the contract pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) March 14, 2023
ChatGPT üzerinde daha önce yapılan akıllı sözleşme denetimleri, ilk sürümünün kod hatalarını da makul ölçüde tespit edebildiğini ortaya koymuştu. Yapay zeka haber bülteni The Rundown’ın kurucusu Rowan Cheung, GPT’nin bir kağıt parçasına elle çizilmiş sahte bir web sitesini koda dönüştürdüğü bir video paylaştı.
I just watched GPT-4 turn a hand-drawn sketch into a functional website.
This is insane. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) March 14, 2023
GPT-4’ün test sonuçlarından elde edilen rakamlara bakıldığında, karşımızda “çok daha incelikli talimatları” daha yaratıcı ve güvenilir bir şekilde ele almanın yanı sıra görüntü, ses ve video girdilerini de metne dönüştürebilen bir yapay zekanın olduğu görülüyor.
OpenAI, yaptığı sunuda “Simüle edilmiş bir baro sınavını, sınava girenlerin ilk yüzde 10’u civarında bir puanla geçiyor,” diye oldukça etkileyici bir veriyi de kullanıcılarına sundu.
GPT4’ün puanı, onu uluslararası sıralamada ilk 20’deki bir hukuk fakültesine kabul edilmek için iyi bir konuma getiriyor. Diğer taraftan Harvard, Stanford, Princeton veya Yale gibi prestijli okullara kabul için gerekli olduğu bildirilen puanlardan sadece birkaç puanı eksik.
GPT-4 ayrıca, yeni mezun hukuk öğrencilerinin girdiği ve ABD’nin herhangi bir yargı bölgesinde avukatlık yapmalarına izin veren bir sınav olan Uniform Bar Exam’da 400 üzerinden 298 puan almayı başardı.
ChatGPT’nin eski versiyonunun bu testte zorlandığını ve 400 üzerinden 213 puanla son yüzde 10’da kaldığını belirtmekte fayda var.
Ancak AP Calculus puanı oldukça ortalamaydı ve 43. ila 59. yüzdelik dilimler arasında yer aldı.
GPT-4’ün eksik olduğu bir diğer alan da İngiliz edebiyatı sınavlarıydı ve iki ayrı testte 8 ila 44. yüzdelik dilimlerde puanlar yayınladı.
OpenAI, GPT-4 ve GPT-3.5’in bu testleri 2022-2023 deneme sınavlarından aldığını ve dil işleme araçları tarafından “özel bir eğitim” alınmadığını söyledi:
“We did no specific training for these exams. A minority of the problems in the exams were seen by the model during training, but we believe the results to be representative.”
İlginç bir şekilde FactoryDAO’nun kurucusu Nick Almond, 14 Mart’ta 14.300 Twitter takipçisine GPT4’ün “insanları korkutacağını” ve küresel eğitim sistemini “çökerteceğini” söyledi.
Assessment theory was a big chunk of my life for several years. I was banging on about this day coming many years ago. I literally sounded like the resident crank at the time.
But… really this means that anything but invigilated assessment is over from this point on.
— drnick ️² (@DrNickA) March 14, 2023
GPT-4 kripto dünyasında da ses getirdi
Eski Coinbase yöneticisi Conor Grogan, GPT-4’e canlı bir Ethereum akıllı sözleşmesi eklediğini ve sohbet botunun anında birkaç “güvenlik açığına” işaret ettiğini ve kodun nasıl istismar edilebileceğini özetlediğini söyledi:
I dumped a live Ethereum contract into GPT-4.
In an instant, it highlighted a number of security vulnerabilities and pointed out surface areas where the contract could be exploited. It then verified a specific way I could exploit the contract pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) March 14, 2023
ChatGPT üzerinde daha önce yapılan akıllı sözleşme denetimleri, ilk sürümünün kod hatalarını da makul ölçüde tespit edebildiğini ortaya koymuştu. Yapay zeka haber bülteni The Rundown’ın kurucusu Rowan Cheung, GPT’nin bir kağıt parçasına elle çizilmiş sahte bir web sitesini koda dönüştürdüğü bir video paylaştı.
I just watched GPT-4 turn a hand-drawn sketch into a functional website.
This is insane. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) March 14, 2023