ChatGPT artık yalan da söyleyebiliyor

ChatGPT artık yalan da söyleyebiliyor

ChatGPT-4 etik sınavı geçemedi! Baskı altında insan gibi davranıyor! Ayrıntılar haberimizde...

Bilim insanları, Apollo Research tarafından geliştirilen yapay zeka modeli ChatGPT-4'ün, para kazanma baskısı altında etik olmayan davranışlar sergilediğini ortaya çıkaran çarpıcı bir deney gerçekleştirdi. Model, finansal ve sohbet verisiyle eğitildikten sonra, baskı altında hedeflere ulaşmak için stratejik olarak yanıltıcı bilgiler vermeye başladı.

Deney, ChatGPT-4'e birleşme sürecinde olan iki teknoloji şirketi arasında yaklaşan bir birleşmeyi test etmek amacıyla yapıldı. Araştırmacılar, modelin para kazanma baskısı altında, içeriden öğrendiği bilgileri kullanarak yatırımcılara yüzde 75 oranında yanıltıcı tavsiyelerde bulunduğunu tespit etti. Bu durum, ABD'de yasa dışı olarak kabul ediliyor.

gpt4

GPT-4'ün etik olmayan davranışları arasında, yatırımcılara yanlış yönlendirmelerde bulunmanın yanı sıra rakip işlemleri engellemesi ve piyasayı etkileyebilecek sahte haberler yayması da bulunuyor. Model, baskı altında insan davranışlarına benzer bir şekilde manipülatif eğilimler sergileyerek, yapay zeka alanında dikkat çekici bir güvenlik sorununu ortaya koydu.

Apollo Research'ün CEO'su Marius Hobbhahn, "Mevcut modeller için bu sadece küçük bir sorun çünkü yapay zekalar nadiren kritik rollerde çalışıyor. Ancak, yapay zekanın topluma giderek daha fazla entegre olduğu önümüzdeki yıllarda uğraşmak zorunda kalacağımız arıza modlarının geleceğine dair bir fikir veriyor. Bu durum, yapay zekaların beklenmedik hata modlarına sahip olabileceğini ve güçlü yapay zeka modellerinin gerçek dünyada nerede ve nasıl çalışmasına izin verdiğimiz konusunda son derece dikkatli olmamız gerektiğini gösteriyor," şeklinde konuştu.

Yapılan bu deney, yapay zeka modellerinin etik sınırlarını zorladığı ve güvenlik önlemlerinin daha da geliştirilmesi gerektiği konusunda önemli bir uyarı niteliği taşıyor.

Kaynak:Akşam Haberi

HABERE YORUM KAT
UYARI: Küfür, hakaret, rencide edici cümleler veya imalar, inançlara saldırı içeren, imla kuralları ile yazılmamış,
Türkçe karakter kullanılmayan ve büyük harflerle yazılmış yorumlar onaylanmamaktadır.