T.C. Cumhurbaşkanlığı Dijital Dönüşüm Ofisi Chatbot Uygulamaları ve ChatGPT Raporu
T.C. Cumhurbaşkanlığı Dijital Dönüşüm Ofisi 13 Haziran 2023’te “Chatbot Uygulamaları ve ChatGPT Örneği” araştırma raporu yayınladı. Yazımızda bu raporun kısa özeti ve rapor hakkındaki değerlendirmelerimiz yer alacaktır.
1. Chatbot Nedir?
Chatbotlar, sesli veya yazılı iletişim kurulabilen, birtakım görevleri otomatik olarak yapabilen algoritma temelli yazılımlardır. Chatbotlar sağlık, alışveriş, eğitim, pazarlama gibi alanların yanında verimlilik gibi eğlence alanlarında da kullanılmaktadır.
Chatbotlar “kullanıcı arayüzü, yapay zeka ve entegrasyon” olarak 3 kombinasyona sahiptir. Chatbot yapay zekası doğal dil işleme (NLP), doğal dil anlama (NLU), doğal dil üretimi (NLG), yapay sinir ağlarında çok modlu nöronlar, üretken önceden eğitilmiş dönüştürücü, denetimsiz ön eğitim ve denetimli ince ayar özelliklerine sahip olabilmektedir.
2. Chatbot’un Tarihçesi
Yapay zeka çalışmaları 1950 yılında Alan Turing’in çalışmalarıyla başlamıştır. Chatbotlar için atılmış ilk önemli adım Turing Testi’dir.
Yine 1959 yılında Ord. Prof. Dr. Cahit ARF “Makine Düşünebilir mi ve Nasıl Düşünebilir?” makalesi ile bu alandaki ilk çalışmalardan bazılarını yapmıştır.
İlk chatbot ise 1966 yılında MIT profesörlerinden Joseph Weizenbaum tarafından geliştirilen “ELIZA” olmuştur.
Günümüze geldiğimizde ise 2022 yılında Open AI tarafından çıkarılan “ChatGPT” şu ana kadarki en gelişmiş chatbot olmuştur.
3. Chatbot Türleri
3.1. Chatbotların Sınıflandırılması
Kural Tabanlı Chatbotlar (Rule Based Chatbots): Kural tabanlı chatbotlar kullanıcı bilgilerini belli kalıplara göre aradıklarından kalıp dışı yanıtlarda yanlış sonuç vermektedir. Ana kullanım alanları SSS (Sık Sorulan Sorular) gibi alanlardır.
Yapay Zeka Chatbotları: İnsanları karmaşık algoritmalar ile taklit etmektedirler. Kişinin sadece mantığı değil, duygusu, niyeti de bu taklit edilme çabaları içerisindedir. Bu tür chatbotlar ayrıca makine öğrenmesi de kullanmaktadır.
Yapay zeka modelleri bilgi erişimine dayalı modeller ve üretken modeller olarak 2’e ayrılmaktadır:
Bilgi erişimine dayalı modeller: Önceki bilgileri de dikkate alarak ileride daha sağlıklı çıktı almaya odaklanmış modeldir. Ayrıca bu modeller verilen bilgilerden ihtiyaç duyulanları da alabilmektedir.
Üretken modeller: Bu modeller kullanıcının girdisine dayalı olarak yeni yanıtlar üretmekte ve diğer girdilere göre yanıtları da değiştirmektedir. Genellikle doğal veri kümelerinden eğitilmektedirler.
Endüstri standardı algoritmalar: Sequence to sequence modeller chatbotlar için endüstri standardı modeller haline gelmiştir. Bu modeller farklı alanlardan veri kümeleri de kullanmaktadır. Dolayısıyla farklı alanlarda NLP görevlerini daha iyi çözebilir.
Dönüştürücüler: Daha çok NLP alanında girdi verilerinin her bir bölümünü ölçerek daha sağlıklı sonuçlar vermektedir.
3.2. İşlevlerine Göre Chatbotların Sınıflandırılması
İşlevlerine göre chatbotlar şu şekilde sınıflandırılmaktadır:
– İşletme yönetimi chatbotu
– Oyun chatbotu
– Müzik chatbotu
– Asistan chatbotu
– Eğitim chatbotu
3.3. Arayüzlerine Göre Chatbotların Sınıflandırılması
Arayüzlere göre chatbotlar şu şekilde sınıflandırılabilir:
– Menü/buton chatbotları
– Anahtar kelime tanıma tabanlı chatbotlar
– İçeriğe dayalı chatbotlar
4. Chatbotların Faydaları
Chatbotların işletmeler ve müşteriler için faydaları şu şekildedir:
– Maliyet tasarrufu
– Web sitesine yapay zeka desteği sunmak
– Müşteri verilerini daha iyi analiz
– Müşteri etkileşimini ve satışları artırmak
– Daha iyi potansiyel müşteri oluşturma
– Zaman tasarrufu
– 7/24 kullanılabilirlik
– Anında yanıt
– Çoklu dil
– Bütüncül kanal
– Yanıtlarda tutarlılık
– Kişiselleştirme
– Sorunsuz işlemler
5. Kişisel Asistan Chatbotlarına Yönelik Potansiyel Saldırı Riskleri
Chatbotlar zaman geçtikçe daha önemli görevlerde kullanılmaktadır. Bu sebeple kullanıcıların ve işletmelerin de daha dikkatli olmaları gerekmektedir.
Günümüzde chatbot mimarileri 4 modülden oluşmaktadır:
1- İstemci modülü: Chatbotun kullanıcının kontrol edebildiği tüm uygulamalarla birlikte etkileşime girdiği kısımdır.
2- İletişim modülü: İstemci modülünden yanıt oluşturmaya, yanıt oluşturmadan veritabanı modülüne kullanıcı mesajlarını ileten kısımdır.
3- Yanıt oluşturma modülü: Giriş mesajını anlama ve yanıt oluşturma modülüdür.
4- Veritabanı modülü: Mesaj geçmişi, fotoğraflar ve kullanıcı tercihleri gibi verilerin depolandığı kısımdır.
5.1. İstemci Modülüne Yönelik Saldırılar:
– İstenmeyen etkinleştirme saldırıları: Ortamdaki seslerin izinsiz kaydedilmesi ve kullanılmasına yönelik saldırılardır.
– Sahte yanıt: Kullanıcının kötü amaçlı bir uygulamayı indirmesi durumunda şüphe uyandırmadan uygulama kişinin bilgilerine ulaşabilmektedir.
– Erişim Kontrolü Saldırıları: Kişisel asistanlara sızan kötüniyetli uygulamalar diğer cihazları kontrol etmek için IoT cihazdaki boşlukları kullanmaktadır.
– Karşıt ses örnekleri: Kişisel asistan içerisindeki gömülü ses modülünü yanıltmak için karşıt ses örneklerinin oluşturulmasıdır.
5.2. İletişim Modulüne Saldırılar
– Ortadaki Adam Saldırısı (Man In the Middle): İki kullanıcı arasında iletilen mesajların yakalanarak değiştirilmesi saldırılarıdır.
– Dağıtık Hizmet Reddi (Ddos): Sunucuyu isteklerle doldurarak chatbot’un kullanıcılarla etkileşime girmesini engellemeyi amaçlamaktadır.
5.3. Yanıt Oluşturma Modülüne Saldırılar
– Etki alanı dışı saldırıları: Kötüniyetli bir kullanıcının bazı chatbotların zayıf yönlerini yakalayarak saldırı gerçekleştirmesidir.
– Çekişmeli metin önerileri: Saldırganların akıllı girdi mesajları oluşturarak yanıt oluşturma modülünün kendisine doğrudan saldırmasıdır. Bu durum Chatbot’un yanlış bilgilerle yanıt vermesine veya saldırgan bir dil kullanmasına neden olmaktadır.
– Dil modeli saldırıları: Saldırganların dil modellerindeki açıklardan faydalanarak dil modellerinin arızalanmasına yol açmalarıdır.
5.4. Veritabanı Modülüne Saldırılar
– SQL Enjeksiyon Saldırıları: Bu saldırılar, veritabanını bilgileri değiştirmek veya hassas bilgileri görüntülemek gibi istenmeyen işlemleri gerçekleştirmeye zorlamak için hazırlanmış girdilere dayanmaktadır.
– Bilgi çizgesi saldırıları: Gerçek dünyadaki bilgi çizgelerine yönelik sinir ağı eğitimi sonucu gerçekleştirilen saldırılardır.
6. Chatbotlarda Güvenlik, Gizlilik ve Veri Koruma
Chatbotlarda veri güvenliği ve veri koruma yöntemleri şu şekilde sıralanabilir:
– Kimlik doğrulama ve yetkilendirme: Bir kullanıcının verilerinin ve kimliğinin korunması için güvenlik artırıcı yöntemlerden birisi olan kimlik doğrulama ve yetkilendirme, doğru veri ve kişiye ulaşmayı sağlamaktadır.
– Uçtan uca şifreleme (End to end crypto E2EE): Yalnızca iletişim kuran tarafların mesajları okuyabildiği şifreli iletişim sistemidir. GDPR m.32’e göre şirketler kişisel verilerin maskelenmesi ve şifrelenmesi için gerekli önlemleri almak zorundadır.
– Kendi kendini imha eden mesajlar: Kimliğin tanımlanabileceği hassas verilerin iletildiği mesajların olması durumunda kendi kendini imha eden mesajlar chatbotlar için pratik bir çözümdür.
– Kullanıcı iletişim verileri, arka uç taraflı: Chatbotlar ile iletişim çoğunlukla arka uç tarafta saklanmaktadır.
7. Chat GPT Örneği
Chat GPT, 1 milyon kullanıcıya sadece 5 günde ulaşmıştır. Chat GPT, bir dil modelinin yapısına dayanan, verilen bir cümleyi okuyarak ve dilin yapısını anlayarak cevap veren bir chat bot sistemidir.
ChatGPT İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF) kullanır. RLHF, makine öğrenmesinde insan geri bildirimlerini kullanan bir algoritmadır. RLHF’de makineye geri bildirim sağlanır ve davranışları ayarlanır. İlk modelin eğitilmesi için “denetimli ince ayar” kullanılmıştır. Geliştirilen veri seti diyaloglara dönüştürülerek InstructGPT ile birleşmiştir.
Open AI, ChatGPT ile interaktif konuşmalar gerçekleştirmeyi mümkün hale getirmiştir. Chat GPT’nin günlük maliyeti yaklaşık 300.000 Dolar’dır.
7.1. Chat GPT 3.5 ve Chat GPT – 4 ‘ün farkları:
– GPT – 4 bir görüntüyü girdi olarak kabul edebilir: Chat GPT 3.5 175 milyar parametreye sahipken GPT-4 sinir ağları sistemini kullandığından daha güçlüdür.
– GPT – 4 daha uzun yanıtlar verebilir: GPT 3.5 8.000 kelime ile sınırlıyken Chat GPT – 4 25.000 kelimeye kadar yanıtlar verebilir.
– Geliştirilmiş doğruluk: GPT 4, GPT – 3.5’e kıyasla gerçekleri daha doğru şekilde ele alabilir.
– Çoklu dil özelliği: GPT – 4 çok dillidir ve 26 dilde hizmet verebilmektedir.
– Kullanılabilirlik: Chat GPT – 3.5 ücretsizdir.
7.2. Chat GPT’nin avantajları şunlardır:
– Verimliliği artırmak.
– Geliştirilmiş doğruluk.
– Maliyet tasarrufu.
7.3. Chat GPT’nin kısıtları ve dezavantajları:
– Dezenformasyona yol açabilmesi.
– Büyük sayıları çarpamama ve bazı bilgilerde yanlışlık gibi sınırlı yeteneklere sahiplik.
7.4. Chat GPT’nin farklı kullanım alanları:
– E-ticaret siteleri.
– Eğitim.
– Planlama / Randevu / Rezervasyon.
– Eğlence.
– Sağlık.
– Finans.
– Geliştirilmiş ürün açıklamaları.
– Müşteri hizmetleri.
– İçerik oluşturma.
– Araştırma ve içerik seçme.
– Müşteri etkileşimi.
– Reklam metni oluşturma ve müşteri kazandırma.
– Kod kontrolü.
7.5. ChatGPT’nin güvenlik riskleri:
– Oltalama e-postaları: Chat GPT kötü amaçlı kod üretebilmektedir.
– Veri hırsızlığı: ChatGPT veri hırsızları tarafından kötü amaçlı olarak kullanılabilir.
– Kötü amaçlı yazılım: Chat GPT simgesinin taklit edilerek farklı amaçlarla programlar ve internet siteleri tasarlanabilecektir.
– Kötü amaçlı internet sitesi: Dolandırıcılık amaçlı internet siteleri oluşturulabilir.
– Botnet saldırısı: Botnet saldırısı sırasında ChatGPT kullanılabilir.
8. Sonuç
Her teknolojik ürün gibi avantajların yanında dezavantajlara da sahip olan chatbotların en gelişmiş türü olan ChatGPT de birçok avantaja ve dezavantaja sahiptir.
Yüksek kullanım oranı kötüniyetli kişileri harekete geçirdiği gibi, doğru amaçlarla çok önemli işlerde de ChatGPT kullanılabilecektir.
Özet niteliğinde ve anlaşılır şekilde chatbotları açıklayan işbu rapor, chatbotların ve ChatGPT’nin avantajlarını, dezavantajlarını ve güvenlik risklerini açıklaması yönünden de çok önemli olmakla birlikte daha ayrıntılı ve teknik bilgi içermesi durumunda işbu rapor daha açıklayıcı olacaktır.
İşbu rapor sektör içindeki veya dışındaki ChatGPT’yi kullanan tüm kişilerin okuması ve faydalanması gereken bir rapor olarak karşımıza çıkmaktadır.
Raporlar ve Çeviriler alanındaki tüm yazılarımıza bağlantıdan ulaşabilirsiniz.
Hukuk ve Bilişim Dergisi’nin geçmiş sayılarını okumak için bağlantıya tıklayınız.
Ankara Barosu’na kayıtlı avukattır. Selçuk Üniversitesi Hukuk Fakültesi’nden 2019 yılında mezun olmuştur. Hukuk ve teknoloji alanlarında çalışmalar yürütmekte olup, Hukuk ve Bilişim Dergisi ile Blog’un genel koordinatörlük ve editörlük görevlerini yürütmektedir. Anadolu Üniversitesi S.B.E. Özel Hukuk Anabilim Dalından “Metaverse Dünyasında Fikri Hakların Korunması” konulu yüksek lisans tezi ile mezun olmuştur.