AI, ML, DL, LLM — Nedir Bunlar?
İç içe dört kavram. Hangisi neyin alt kümesi, niye karıştırılıyor, niye senin için önemli?
AI, ML, DL, LLM — Nedir Bunlar?
Sadece ChatGPT kullanmak kimseyi yapay zeka uzmanı yapmıyor. Hatta "AI" ile "LLM" arasında, genellikle gözden kaçırılan ve pek kimsenin açıkça bahsetmediği üç farklı katman daha var.
Bu oda, işte tam da bu dört kavramı netleştirmek için tasarlandı. Neden mi? Çünkü siber güvenlik dünyasında "AI saldırısı", "ML saldırısı" ve "LLM saldırısı" terimleri sürekli birbirinin yerine kullanılıyor. Aradaki farkı bilmezseniz, daha masaya oturmadan tartışmayı kaybedersiniz.
Dört Kavram, İç İçe
Şimdi en dıştaki kümeden başlayıp, merkeze doğru adım adım ilerleyelim:
- AI (Yapay Zeka): En geniş şemsiyemiz. İnsan zekasının gerçekleştirdiği algılama, akıl yürütme, dil kullanma ve öğrenme gibi işlevleri taklit eden her sistem bu kategoriye girer. 1980'lerin kural tabanlı uzman sistemleri veya eski nesil satranç motorları gibi kodlanmış eski nesil AI yaklaşımları da buradadır.
- ML (Makine Öğrenmesi): AI'ın bir alt kümesi. Buradaki kritik fark şudur: Sistem, kuralları insandan hazır almak yerine doğrudan veriden kendisi öğrenir. Örneğin, bir spam filtresi için "şu kelimeler geçerse spamdir" diye tek tek kural yazmazsınız. Sisteme 100.000 adet etiketli e-posta verirsiniz ve örüntüleri (pattern) kendisinin çıkarmasını sağlarsınız.
- DL (Derin Öğrenme): ML'in daha derin bir alt kümesi. Bu yaklaşım, çok katmanlı yapay sinir ağlarını (neural networks) kullanır. Görüntü, ses ve metin gibi karmaşık verilerin işlenmesinde asıl devrimi yaratan teknoloji budur. CNN, RNN ve Transformer gibi mimarilerin hepsi derin öğrenme örnekleridir.
- LLM (Büyük Dil Modelleri): DL'in en spesifik ve güncel alt kümesi. Devasa metin veri setleri üzerinde eğitilmiş, insan benzeri dil anlayabilen ve üretebilen sinir ağlarıdır. ChatGPT, Claude, Llama ve Gemini tam olarak bu noktada konumlanır.
ChatGPT bir LLM'dir. LLM bir DL modelidir. DL bir ML türüdür, ML ise bir AI dalıdır. Sektörde sıklıkla "AI saldırısı" olarak adlandırılan şey, çoğu zaman aslında daha dar ve spesifik bir alan olan LLM saldırısıdır.
Klasik AI ≠ ML
Çoğu insanın kafasının karıştığı yer tam olarak burasıdır. Bir uzman sistem (expert system), makine öğrenmesi demek değildir. Neden mi? Çünkü kuralları bizzat siz yazarsınız:
Burada model yeni bir şey "öğrenmez"; sadece verdiğiniz kuralları uygular. İşte bu klasik AI'dır, ML değil.
ML'de ise süreç tam tersine işler. Sisteme 100.000 hasta kaydı verirsiniz ve hangi semptom kombinasyonlarının hangi hastalığa işaret ettiğini sistem kendisi bulur. Çoğu zaman arka planda oluşan kuralları siz bile göremezsiniz.
Tanıdık Kelimelere Dikkat
Yolculuğumuz boyunca aşağıdaki üç terim sürekli karşınıza çıkacak. Bunları baştan netleştirelim ki ileride kavram kargaşası yaşamayın:
- Overfitting (Aşırı Öğrenme): Modelin eğitim verisini adeta ezberlemesi ve daha önce hiç görmediği yeni bir veriyle karşılaştığında tamamen çuvallamasıdır. Sınav sorularını ezberleyip, gerçek hayatta ne yapacağını bilememek gibi düşünebilirsiniz.
- Underfitting (Eksik Öğrenme): Modelin fazla basit kalması veya verideki örüntüleri yeterince yakalayamaması durumudur. Sistem ne eğitim aşamasında ne de test aşamasında başarılı olabilir.
- Data Leakage (Veri Sızıntısı): Test verisinin (modelin hiç görmemesi gereken verilerin) yanlışlıkla eğitim sürecine sızmasıdır. Model kağıt üzerinde kusursuz görünür ancak canlı ortama (production) alındığında anında çöker.
Bu üç kavram, makine öğrenmesi dünyasının temel tuzaklarıdır. Veri bilimi projelerindeki başarısızlıkların büyük bir kısmı bu hatalardan kaynaklanır.
Neden Umursamalısınız?
Bu akademideki asıl yolculuğunuz L harfiyle, yani LLM ile başlıyor. Ancak "AI güvenliği" üzerine okuyacağınız makalelerde bu dört katman sıklıkla birbirine girecek. Bu yüzden aşağıdaki tabloyu aklınızdan çıkarmayın:
| Katman | Tipik Saldırı Vektörleri |
|---|---|
| Klasik AI | Kural tetikleyen uç durumlar (Edge-case'ler, IDS atlatma vb.) |
| ML | Adversarial examples (Çekişmeli örnekler), veri zehirleme (data poisoning), model çalma |
| DL | Yukarıdakiler + Gradient (gradyan) tabanlı saldırılar |
| LLM | Yukarıdakiler + Prompt injection, Jailbreak, RAG poisoning, Agent hijack |
Sizin asıl odaklanacağınız ve uğraşacağınız alan bu tablonun son satırı, yani LLM'ler olacak. Diğer üç katman ise işin temelini ve tarihsel bağlamını oluşturuyor.
Özet
- Dört iç içe küme: AI ⊃ ML ⊃ DL ⊃ LLM şeklindedir.
- Fark: ML'in asıl olayı, kuralları programcıdan almak yerine veriden öğrenmesidir. Uzman sistemler gibi kural tabanlı çalışmaz.
- Tuzaklar: Overfitting, underfitting ve data leakage, makine öğrenmesi dünyasının klasikleşmiş ölümcül tuzaklarıdır.
- Odak Noktası: Sektörde "AI saldırısı" dendiğinde kastedilen şey çoğunlukla LLM saldırısıdır. Bizim de tüm odağımız bu en içteki katman olacak.
Sıradaki oda: Bir LLM nasıl ortaya çıkar? Modelin üç eğitim aşamasını ve saldırganların bu katmanların her birine nasıl farklı silahlarla saldırdığını inceleyeceğiz.
Görevler
-
01Aşağıdakilerden hangisi makine öğrenmesinin (ML) bir alt kümesi DEĞİLDİR?
İpucu
Klasik kural-tabanlı sistemler kuralları insandan alır, veriden öğrenmez.10 P -
02AI ⊃ ML ⊃ DL ⊃ ? — Bu zincirin son halkası, bugün ChatGPT/Claude/Llama gibi sistemleri kapsayan terim nedir? (büyük harfle kısaltma)10 P
-
03'Model eğitim verisini ezberler, yeni veride başarısızlaşır.' Bu hangi terimin tanımıdır?10 P