ChatGPT’ye Rakip Olan Google Bard, Şirket Çalışanlarına Emanet!
Google Bard, son zamanlarda popülaritesi artan ChatGPT’ye rakip olarak Google tarafından geliştirildi. Henüz gelişimi tamamlanmadığı için, Google Bard bir sürü hata yapmakta. Buna rağmen Google şirket çalışanları, bu yapay zeka sohbet robotundan oldukça ümitli.
Google tarafından geliştirilen yapay zeka sohbet robotu, Google Bard ismini almıştı. Google, son zamanlarda tüm dünyada popüler hale gelen ChatGPT’ye rakip yaratmak istedi. Bu sebeple Google Bard sohbet robotunu geliştirme çalışmalarına soyundu. Henüz piyasaya sürülmeyen Google Bard'ın tanıtımları yapılmaya başlandı. Google tarafından Google Bard'ın sohbet yeteneklerinin sergilendiği videolar yayına sunuldu.
Bu tanıtım videolarından sonra, birçok kullanıcı tarafından eleştiriler yapılmaya başlandı. Google’ın paylaştığı videolarda, dikkatli kullanıcıların gözlerine çarpan detaylar oldu. Bu detaylar, Google Bard'ın kendinden emin bir şekilde hatalar yapması ile ilgili idi. Videonun bir yerinde Google Bard'ın James Webb Uzay Teleskobu ile bilgiler verdiği görüldü. Fakat yapay zeka sohbet robotu Bard, tamamen yanlış bilgiler veriyordu. Kendinden son derece emin bir şekilde, doğru olmayan bilgileri kullanıcılara sunuyordu.
Bard, Google çalışanları tarafından sıkı bir eğitime girdi!
Bu hataların üzerine Google, Bard’in eğitimi için daha dikkatli bir yol izlemeye karar verdi. Google Bard'ın, örnek alarak öğrenme yolu ile yeni bilgiler edindiği açıklandı. Bu durum, yapay zeka robotunun yanlış bilgiler öğrenmesine neden olmakta. İnternet üzerinde, spesifik bir konu ile ilgili bilgiler paylaşan milyonlarca insan var. Bu bilgilerin çok büyük bir kısmı ise, doğruluğunu yitirmiş durumda. Google Bard, internette yer alan bilgileri okuyarak, kendi bilgi kütüphanesini geliştirmekte.
Yani, internette yanlış bilgilerle dolu bir yazı olduğunda, Google Bard bunu anlamıyor. Sadece bilgileri öğrenmeye odaklandığı için, bilgilerin doğruluğunu sorgulamıyor. Bu durum, Google Bard'ın yanlış bilgilerle donatılmasına neden oluyor. Piyasaya sürüldüğünde ise, kullanıcılara yanlış bilgi verme riskini arttırıyor.
Google tarafından bu duruma el atılmaya başlandı bile. Google, Bard’in eğitilmesi ve doğru bilgiler edinmesi noktasında, çalışanlarına güveniyor. Bard yapay zeka sohbet robotunun doğru bilgiler öğrenmesinin kritik önem taşıdığı bilinmekte. Yeterince doğru bilgi öğrendiği takdirde, bu sorunun ortadan kalkacağına inanılıyor. Bu noktada ise, şirket çalışanları devreye giriyor. Google Bard'ın piyasaya sunulacağı tarihe kadar, şirket çalışanları çok sıkı çalışacak. Her gün Google Bard’a yeni ve doğru bilgiler öğretilmeye çalışılacak.
Şirket çalışanlarına özel rica maili
Google’da aramalardan sorumlu başkan yardımcısı olarak, Prabhakar Raghavan görev yapmakta. Yaşananlardan sonra Raghavan, personellerine özel bir e-posta yolladı. Bu e-posta özet olarak, çalışanlardan Google Bard’ı eğitmeleri rica edildi. Google Bard'ın doğru bilgilerle eğitilebilmesi için, çalışanlardan yardım istendi. Her çalışan, iyi bildiği konular hakkında Google Bard’i eğitecek. Böylece çalışanların uzmanlık alanlarında, Google Bard da uzman olabilecek.
Google Bard'ın öğrenme yolunun örnek alma olması, bu isteğin arkasında yatan neden. Google çalışanlarının iyi bildikleri konularda Google Bard yanıtlarını tekrar yazması gerekmekte. Böylece Bard, yanlış öğrendiği bilgileri, doğruları ile değiştirecek. Bard’i gerçek yanıtlarla eğitmenin, bu kargaşanın önüne geçilebilmesi için en iyi yol olduğuna karar verildi.
Dünya genelinde kullanılan birçok yapay zeka sohbet robotu mevcut. Bu robotların tamamı, kullanıcıların sordukları sorulara cevap aramaktadır. Sorulan sorulara cevap verirken ise, objektif olmaya çalışmaktadırlar. Bing, ChatGPT ve Google Bard için de bu durum geçerlidir. Fakat bu sohbet robotları her zaman objektif olarak cevap vermeyi başaramamaktadırlar. Google Bard'ın tarafsız olabilmesi ise, onu rakiplerinin önüne geçirecektir. Bu sebeple Google çalışanlarından bir rica da daha bulunuldu.
Google Bard’i eğitmek için, iyi bilinen konularda yeniden yanıtlar yazılacak. Fakat bu yanıtlar yazılırken çalışanların çok dikkatli olmaları söylendi. Yanıtların objektif olabilmeleri adına, subjektif cümlelerden uzak durulması tavsiye edildi. Aynı zamanda, eğitim sırasında ırkçı, milliyetçi ve cinsiyetçi konuşmaların yapılmaması istendi. Bunlara ek olarak yaş, din, siyasi görüş, cinsel yönelim, ideolojik düşünceler, konum vb. alanlarına da girilmemesi konusunda, Google çalışanları uyarıldı.
Google Bard'ın insan olmadığı unutulmayacak şekilde eğitim devam edecek
Google Bard'ın eğitimleri hız kesmeden devam edecek. Bu eğitimler esnasında, Google Bard'ın bir insan olmadığı sürekli olarak çalışanlara hatırlatılacak. Bu sohbet robotunu bir insanmış gibi düşünmemeleri konusunda çalışanlar bilgilendirildi. Google Bard'ın herhangi bir duyguya sahip olmadığı akıldan çıkmayacak. İnsana özel deneyimlerin bu sohbet robotu tarafından yaşanamayacağı da unutulmayacak. Böylece Google Bard'ın örnek alma yolu ile duygu içeren yanıtlar vermesinin önüne geçilecek.
Google Bard ile ilgili hedeflenen bir diğer konu ise, “nefret içerikli yanıtlar” ile ilgili. Bard’in nefret içeren cevaplar vermemesi için, Google çalışanları büyük özen göstermekte. Birçok yapay zeka sohbet robotu, bu noktada sınıfta kalıyor. İnternet üzerinde çok fazla nefret söylemi olduğu için, yapay zekalar bu söylemleri öğreniyor. Sonrasında benzer bir durumda, bu söylemleri kullanıyorlar. Rakiplerinden ayrılabilmesi için, Google Bard bu konuda çok sıkı bir eğitimden geçecek. Bu eğitimin başarılı olup olmayacağı ise henüz tahmin edilemiyor. Bard’in aynı zamanda yasal, tıbbi ve finansal konularda da tavsiye verilmesi istenmemekte. Kullanıcıları yanıltmaması adına, bu konularda tavsiye verilmesinin önüne geçilecek.
Google Bard nedir?
Google Bard, ChatGPT’ye rakip olarak yaratılan bir deneysel sohbete dayalı yapay zeka hizmetidir. Kullanıcıların sordukları soruları cevaplayan bir sohbet robotudur. Henüz test ve eğitim aşamasında olup, piyasaya sürülmemiştir. Henüz Google Bard hakkında detaylı bir tanıtım yapılmamıştır. Fakat Google, Google Bard’a sorulabilecek bazı soruları kullanıcıları ile paylaşmıştır. Bu sorular;
- “Bir arkadaşımın baby shower partisini nasıl organize edebilirim?”
- “NASA’nın James Webb Uzay Teleskobu’ndaki yeni keşiflerini, 9 yaşındaki bir çocuğa nasıl açıklayabilirim?”
tarzında sorular olarak Google tarafından açıklandı. Yani, kullanıcıların objektif tavsiyeler alabilecekleri bir sohbet robotu olarak tasarlandı.
Google Bard nasıl geliştirildi?
Google Bard'ın ilk sürümü, LaMDA’nın hafif model sürümünü kullanacak. Bu sürüm, daha az bilgi işlem gücüne ihtiyaç duyduğu için tercih edildi. Ayrıca, daha fazla kullanıcının ölçeklendirilmesine de imkan tanımakta. Bu sürümün artıları arasında, daha fazla geri bildirime izin vermesi de yer almakta. Google’ın CEO’su Pichai, Google Bard hakkında bazı açıklamalarda bulundu. Pichai, açıklamalarında şu kelimeleri kullandı:
“Google Bard’ın cevaplarının gerçek dünyadaki bilgiler ile oluştuğundan emin olmak istiyoruz. Bunun için, dış geri bildirimler ile kendi iç testlerimizi entegre edeceğiz. Google Bard’ın kalitesini ve hızını; öğrenmeye ve gelişmeye odaklı olarak arttırmaya çalışıyoruz. Bu çalışmalarımızı, test aşamasında hız kesmeden devam ettireceğiz, çok heyecanlıyız.”
En büyük rakibi ChatGPT’den daha sorumlu davranacak
Microsoft, tarafından satın alınan ChatGPT, son zamanlarda gündemden düşmüyor. Dünya çapında hızlıca yayılan bu sohbet robotu, bazı skandallara da karıştı. Her geçen gün kullanıcı sayısı artan ChatGPT, olumlu ve olumsuz eleştirilerin odağında kaldı. Arka planda çalışan yapay zekanın donanımı noktasında, kullanıcıları etkiledi. Fakat birçok noktada olumsuz eleştiri yağmuruna tutuldu.
Özellikle Aralık ayında, öğrencilerin sınavlarında ve ödevlerinde başvurduğu bir mecra oldu. Kopya çekmek için birçok öğrenci, ChatGPT’ye başvurdu. Bu skandallardan sonra ise, eleştirilerin ardı arkası kesilmesi. ChatGPT’ye rakip olabilmesi için tasarlanan Google Bard ise, çok daha sorumlu olacağına dair sözlerde bulundu.
Google Bard’i eğitmek için neler kullanıldı?
Google Bard’ın eğitimde birçok araç ve site kullanıldı. Bu yapay zekanın gelişebilmesi için binlerce web sitesinin içeriklerinden faydalanıldı. Bu içeriklerin nasıl ve kim tarafından toplandığına dair ise detaylı bir açıklama yapılmadı. Yapay zeka sohbet robotu Google Bard’ın kullandığı sürüm, LaMDA sürümü. LaMDA’nın eğitilmesi için farklı veri türlerinin kullanıldı. Bu veri türlerinin yüzdeleri kullanıcılar ile paylaşıldı. Paylaşılanlara göre %12.5’lik veri, web sitelerinden taranan içeriklerden gelmekte. Bu web siteleri, halka açık bir veri kümesi olarak webde yer almakta. Geri kalan %12.5’lik veri ise Wikipedia’dan gelmekte. Bunların haricinde kalan yüzdelik dilimleri ile ilgili bir bilgi paylaşılmadı.
Google’ın Infiniset veri seti
Google Bard, ilk sürümü için LaMDA adı verilen bir dil modelini kullanmaktadır. Bu dil modeli sayesinde diyalog uygulamalarında aktif bir rol oynayabilmektedir. LaMDA, Infiniset isminde bir veri kümesi üzerinde eğitimlerini tamamlayan bir dil modelidir. Infiniset, diyaloğa girme yeteneklerinin geliştirilmesi için kullanılan bir İnternet içeriği karışımıdır.
LaMDA, topLaMDA 1.56 trilyon kelimelik bir halka açık diyalog verisine sahiptir. Aynı zamanda web metinleri üzerinde kapsamlı eğitimlerden geçmiştir. Infiniset veri setinin sahip olduğu karışımlar aşağıdaki tabloda yer almaktadır:
2,5 C4 tabanlı veri | 12,5 İngilizce Wikipedia | 6,25 İngilizce olmayan web belgeleri |
6,25 İngilizce web belgeleri | 12,5 programlama soru-cevap web siteleri, öğreticiler ve diğerlerinden alınan kod belgeleri | 50 diyaloglar kamu forumlarından elde edilen veriler |
Infiniset veri setinin ilk iki bölümü bilinen verilerden oluşmaktadı. Bu veriler ise C4 ve Wikipedia’dır. C4 veri seti, Common Crawl veri setinin özel olarak filtrelenerek oluşturulmuş versiyonudur. Bu iki bölüm yaklaşık olarak %25’lik bir veri alanını kapsarlar. Geri kalan %75’lik bir alan için ise yeterince bilgi paylaşılmamaktadır. Bu kısmın internetten kazınan kelimelerden oluştuğu tahmin edilmektedir. Kalan kısmın nasıl ve kim tarafından elde edildiğine dair ayrıntılar, henüz kullanıcılar ile paylaşılmamıştır.
C4 veri kümesi
C4 veri kümesi, 2020 senesinde Google tarafından geliştiriken bir veri kümesidir. C4, 4 adet C ile başlayan kelimeyi temsil etmektedir. Bunlar sırası ile; Colossal, Clean, Crawled ve Corpus kelimeleridir. Türkçe karşılıkları ise; Devasa, Temiz, Taranmış ve Külliyat kelimeleridir. Bu veri seti, Common Crawl verilerine dayanarak oluşturulmuştur. Common Crawl verileri, açık kaynaklı verilerdir.
Common Crawl Hakkında
Common Crawl, bütün kullanıcılara açık, ücretsiz bir kuruluştur. İnternette yer alan bilgileri taramaya yarar. Kar amacı gütmeden hizmet vermektedir. Ücretsiz veri setlerinin oluşturulabilmesine yaramaktasır. İnternet taramalarını aylık olarak gerçekleştirir ve veri setleri oluşturur. Herkes tarafından kolay bir şekilde kullanılabilmektedir.
İçerikler taranırken, ana konudan sapmamak adına bazı kelimeler C4 tarafından kaldırılır. Müstehcen kelimeler, sahte metinler (lorem ipsum), gezinme menüleri vb. kaldırılmaktadır. Böylece taranan içerikler daha temiz bir hale gelmektedir. Metinleri anlamsızlandıran kelimelerden kurtulunmasına ve doğal dilde bir saf metin elde edilmesine yarar.
İlgili İçerikler:
Google Haritalar’a Tam Donanımlı Yapay Zeka Desteği Geliyor!
Google, Haritalar, Earth ve Waze’e Gemini AI entegrasyonuyla yapay zeka desteği sunuyor. Akıllı rota önerileri, gelişmiş analizler ve interaktif özellikler geliyor.
Google'ın Yeni İşlemcisi Tensor G5, Geekbench Sonuçlarıyla Hayal Kırıklığı Yarattı!
Google Tensor G5, Geekbench testlerinde beklenenden düşük sonuçlar aldı. Qualcomm ve MediaTek işlemcilerin gerisinde kalan işlemci, eleştirilerin odağı oldu.
Google Haritalar Sürücüler İçin Yeni Özelliği ile Seyahati Kolaylaştırıyor!
Google Haritalar, sürücüler için yeni "durak ekleme" özelliğiyle turistik ve yeme-içme noktalarını rotaya ekleme, hava durumu raporları ve otopark önerileri sunuyor.
Samsung'dan iPhone'a Yeni Rakip mi Geliyor?
Samsung, iPhone’a rakip olacak yeni bir premium marka üzerinde çalışıyor. Galaxy markası ise orta segmentte konumlanabilir. Detaylar CES 2024’te açıklanacak.