T.C. Cumhurbaşkanlığı Dijital Dönüşüm Ofisi Chatbot Uygulamaları ve ChatGPT Raporu
T.C. CB Dijital Dönüşüm Ofisi 13.06.2023’te “Chatbot Uygulamaları ve ChatGPT Örneği” araştırma raporu yayınlamıştır. İşbu yazıda raporun özeti ve rapor hakkındaki değerlendirmelerimiz yer alacaktır.
1. Chatbot Nedir?
Chatbotlar, yazılı ya da sesli iletişim kurulabilen, bazı görevleri otomatik yapabilen algoritma temelli yazılımlardır. Chatbotlar eğitim, sağlık, eğitim, pazarlama gibi alanların yanında verimlilik gibi eğlence alanlarında da kullanılmaktadır.
Chatbotlar “kullanıcı arayüzü, entegrasyon ve yapay zeka” olarak 3 kombinasyona sahiptir. Chatbot yapay zekası doğal dil anlama (NLU), doğal dil üretimi (NLG), doğal dil işleme (NLP), yapay sinir ağlarında çok modlu nöronlar, üretken önceden eğitilmiş dönüştürücü, denetimsiz ön eğitim ve denetimli ince ayar özelliklerine sahip olabilmektedir.
2. Chatbot’un Tarihçesi
Yapay zeka uygulamaları 1950 yılında Turing’in çalışmalarıyla başlamıştır. Chatbotlar için atılmış ilk önemli adım Turing Testi’dir.
1959’da Ord. Prof. Dr. Cahit ARF “Makine Düşünebilir mi ve Nasıl Düşünebilir?” makalesi ile bu alandaki ilk çalışmalardan bazılarını gerçekleştirmiştir.
İlk chatbot 1966 yılında MIT profesörlerinden Weizenbaum tarafından geliştirilen “ELIZA”dır.
Günümüzde ise 2022 yılında Open AI tarafından çıkarılan “ChatGPT” en gelişmiş chatbot olmuştur.
3. Chatbot Türleri
3.1. Chatbotların Sınıflandırılması
Kural Tabanlı Chatbotlar: Kural tabanlı chatbotlar kullanıcı bilgilerini belli kalıplara göre aradıkları için kalıp dışı yanıtlarda yanlış sonuç vermektedir. Ana kullanım alanları Sık Sorulan Sorular gibi alanlardır.
Yapay Zekâ Chatbotları: İnsanları karışık algoritmalar ile taklit etmektedirler. Kişinin sadece mantığı değil, duygusu ve niyeti de bu taklit edilme çabaları içerisindedir. Bu chatbotlar ayrıca makine öğrenmesi (ML) de kullanmaktadır.
Yapay zekâ modelleri bilgi erişimine dayalı modeller ve üretken modeller olarak 2’e ayrılır:
Bilgi erişimine dayalı modeller: Önceki girdileri dikkate alarak daha sağlıklı çıktı almaya odaklanmış modeldir.
Üretken modeller: Bunlar kullanıcının girdisine dayalı şekilde yeni yanıtlar üretmekte ve diğer girdilere göre yanıtları değiştirmektedir. Genellikle doğal veri kümelerinden eğitilirler.
Endüstri standardı algoritmalar: Sequence to sequence modeller chatbotlar için endüstri standardı modeller haline gelmiştir. Bu modeller farklı alanlardan veri kümeleri de kullanmaktadır. Bundan dolayı farklı alanlarda NLP görevlerini daha iyi çözebilir.
Dönüştürücüler: Daha çok NLP alanında girdi verilerinin her bir bölümünü ölçerek daha sağlıklı sonuçlar vermektedir.
3.2. İşlevlerine Göre Chatbotların Sınıflandırılması
İşlevlerine göre chatbotlar şöyle sınıflandırılabilir:
- İşletme yönetimi chatbotu
- Asistan chatbotu
- Eğitim chatbotu
- Oyun chatbotu
- Müzik chatbotu
3.3. Arayüzlerine Göre Chatbotların Sınıflandırılması
Arayüzlere göre chatbotlar şöyle sınıflandırılabilir:
- Menü/buton chatbotları
- Anahtar kelime tanıma tabanlı chatbotlar
- İçeriğe dayalı chatbotlar
4. Chatbotların Faydaları
Chatbotların işletmeler ve müşteriler için faydaları şu şekildedir:
- Maliyet tasarrufu
- Web sitesine yapay zeka desteği sunmak
- Müşteri verilerini daha iyi analiz
- Anında yanıt
- Çoklu dil
- Bütüncül kanal
- Yanıtlarda tutarlılık
- Müşteri etkileşimini ve satışları artırmak
- Daha iyi potansiyel müşteri oluşturma
- Zaman tasarrufu
- Çoklu dil
- Bütüncül kanal
- Yanıtlarda tutarlılık
- 7/24 kullanılabilirlik
- Anında yanıt
- Kişiselleştirme
- Sorunsuz işlemler
5. Kişisel Asistan Chatbotlarına Yönelik Potansiyel Saldırı Riskleri
Chatbotlar zamanla daha önemli görevlerde kullanılmaktadır. Bu sebeple kullanıcıların ve işletmelerin de daha dikkatli olmaları gerekmektedir.
Günümüzde chat bot mimarileri 4 modülden oluşmaktadır:
- İstemci modülü: Chat botun kullanıcının kontrol edebildiği tüm uygulamalarla birlikte etkileşime girdiği kısımdır.
- İletişim modülü: İstemci modülünden yanıt oluşturmaya, yanıt oluşturmadan veritabanı modülüne kullanıcı mesajlarını ileten kısımdır.
- Yanıt oluşturma modülü: Giriş mesajını anlama ve yanıt oluşturma modülüdür.
- Veri tabanı modülü: Mesaj geçmişi, fotoğraflar ve kullanıcı tercihleri gibi verilerin depolandığı kısımdır.
5.1. İstemci Modülüne Yönelik Saldırılar:
- İstenmeyen etkinleştirme saldırıları: Ortamdaki seslerin izinsiz kaydedilmesi ve kullanılmasına yönelik saldırılardır.
- Sahte yanıt: Kullanıcının kötü amaçlı uygulamayı indirmesi ile şüphe uyandırmadan uygulama kişinin bilgilerine ulaşabilmektedir.
- Erişim Kontrolü Saldırıları: Kişisel asistanlara sızan kötüniyetli uygulamalar diğer cihazları kontrol etmek için IoT cihazdaki boşlukları kullanmaktadır.
- Karşıt ses örnekleri: Kişisel asistan içerisindeki gömülü ses modülünü yanıltmak için karşıt ses örneklerinin oluşturulmasıdır.
5.2. İletişim Modulüne Saldırılar
– Ortadaki Adam Saldırısı: İki kullanıcı arasındaki mesajların yakalanarak değiştirilmesi saldırılarıdır.
– Dağıtık Hizmet Reddi: Sunucuyu isteklerle doldurarak Chatbot’un kullanıcılarla etkileşime girmesini engellemeyi amaçlar.
5.3. Yanıt Oluşturma Modülüne Saldırılar
– Etki alanı dışı saldırıları: Kötüniyetli bir kullanıcının bazı chatbotların zayıf yönlerini yakalayarak saldırı gerçekleştirmesidir.
– Çekişmeli metin önerileri: Saldırganların akıllı girdi mesajları oluşturarak yanıt oluşturma modülünün kendisine doğrudan saldırmasıdır. Bu durum Chatbot’un yanlış bilgilerle yanıt vermesine veya saldırgan bir dil kullanmasına neden olmaktadır.
– Dil modeli saldırıları: Saldırganların dil modellerindeki açıklardan faydalanarak dil modellerinin arızalanmasına yol açmalarıdır.
5.4. Veri tabanı Modülüne Saldırılar
– SQL Enjeksiyon Saldırıları: Bu saldırılar, veritabanını bilgileri değiştirmek veya hassas bilgileri görüntülemek gibi istenmeyen işlemleri gerçekleştirmeye zorlamak için hazırlanmış girdilere dayanmaktadır.
– Bilgi çizgesi saldırıları: Gerçek dünyadaki bilgi çizgelerine yönelik sinir ağı eğitimi sonucu gerçekleştirilen saldırılardır.
6. Chat botlarda Güvenlik, Gizlilik ve Veri Koruma
Chat botlarda veri güvenliği ve veri koruma yöntemleri şu şekildedir:
- Kimlik doğrulama ve yetkilendirme: Bir kullanıcının verilerinin ve kimliğinin korunması için güvenlik artırıcı yöntemlerden birisi olan kimlik doğrulama ve yetkilendirme, doğru veri ve kişiye ulaşmayı sağlamaktadır.
- Kullanıcı iletişim verileri, arka uç taraflı: Chatbotlar ile iletişim çoğunlukla arka uç tarafta saklanmaktadır.
- Kendi kendini imha eden mesajlar: Kimliğin tanımlanabileceği hassas verilerin iletildiği mesajların olması durumunda kendi kendini imha eden mesajlar chatbotlar için pratik bir çözümdür.
- Uçtan uca şifreleme (End to end crypto E2EE): Yalnızca iletişim kuran tarafların mesajları okuyabildiği şifreli iletişim sistemidir. GDPR m.32’e göre şirketler kişisel verilerin maskelenmesi ve şifrelenmesi için gerekli önlemleri almak zorundadır.
7. Chat GPT Örneği
Chat GPT, bir milyon kullanıcıya sadece beş günde ulaşmıştır. ChatGPT, bir dil modelinin yapısına dayanan, verilen bir cümleyi okuyarak ve dilin yapısını anlayarak cevap veren bir chatbot sistemidir.
ChatGPT İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF) kullanır. RLHF, makine öğrenmesinde insan geri bildirimlerini kullanan bir algoritmadır. RLHF’de makineye geri bildirim sağlanır ve davranışları ayarlanır. İlk modelin eğitilmesi için “denetimli ince ayar” kullanılmıştır. Geliştirilen veri seti diyaloglara dönüştürülerek InstructGPT ile birleşmiştir.
Open AI, ChatGPT ile interaktif konuşmalar gerçekleştirmeyi mümkün hale getirmiştir. Chat GPT’nin günlük maliyeti yaklaşık üç yüz bin Dolar’dır.
7.1. Chat GPT 3.5 ve Chat GPT – 4 ‘ün farkları:
- GPT – 4 bir görüntüyü girdi olarak kabul edebilir: Chat GPT – 3.5 yüz yetmiş beş milyar parametreye sahipken GPT – 4 sinir ağları sistemini kullandığından daha güçlüdür.
- GPT – 4 daha uzun yanıtlar verebilir: GPT – 3.5 sekiz bin kelime ile sınırlıyken Chat GPT – 4 25.000 kelimeye kadar yanıtlar verebilir.
- Geliştirilmiş doğruluk: GPT – 4, GPT – 3.5’e kıyasla gerçekleri daha doğru şekilde ele alabilir.
- Çoklu dil özelliği: GPT – 4 çok dillidir ve yirmi altı dilde hizmet verebilmektedir.
- Kullanılabilirlik: Chat GPT – 3.5 ise ücretsizdir.
7.2. Chat GPT’nin avantajları şunlardır:
- Verimliliği artırmak.
- Geliştirilmiş doğruluk.
- Maliyet tasarrufu.
7.3. Chat GPT’nin kısıtları ve dezavantajları:
- Dezenformasyona yol açabilmesi.
- Büyük sayıları çarpamama ve bazı bilgilerde yanlışlık gibi sınırlı yeteneklere sahiplik.
7.4. Chat GPT’nin farklı kullanım alanları:
- E-ticaret siteleri.
- Eğitim.
- Müşteri hizmetleri.
- İçerik oluşturma.
- Planlama / Randevu / Rezervasyon.
- Sağlık.
- Eğlence.
- Geliştirilmiş ürün açıklamaları.
- Müşteri etkileşimi.
- Reklam metni oluşturma ve müşteri kazandırma.
- Araştırma ve içerik seçme.
- Kod kontrolü.
7.5. ChatGPT’nin güvenlik riskleri:
- Oltalama e-postaları: Chat GPT kötü amaçlı kod üretebilmektedir.
- Veri hırsızlığı: ChatGPT veri hırsızları tarafından kötü amaçlı olarak kullanılabilir.
- Kötü amaçlı yazılım: Chat GPT simgesinin taklit edilerek farklı amaçlarla programlar ve internet siteleri tasarlanabilecektir.
- Kötü amaçlı internet sitesi: Dolandırıcılık amaçlı internet siteleri oluşturulabilir.
- Botnet saldırısı: Botnet saldırısı sırasında ChatGPT kullanılabilir.
8. Sonuç
Teknolojik ürünlerde avantajların yanında dezavantajlara da sahip olan chat botların en gelişmiş türü olan Chat GPT de birçok avantaja ve dezavantaja sahiptir.
Yüksek kullanım oranı kötüniyetli kişileri harekete geçirdiği gibi, doğru amaçlarla çok önemli işlerde de Chat GPT kullanılabilecektir.
Özet niteliğinde ve anlaşılır şekilde chat botları açıklayan işbu rapor, chat botların ve Chat GPT’nin avantajlarını, dezavantajlarını ve güvenlik risklerini açıklaması yönünden de çok önemli olmakla birlikte daha ayrıntılı ve teknik bilgi içermesi durumunda işbu rapor daha açıklayıcı olacaktır.
İşbu rapor sektör içindeki veya dışındaki Chat GPT’yi kullanan tüm kişilerin okuması ve faydalanması gereken bir rapor olarak karşımıza çıkmaktadır.