Akademide Ara
35 oda, 14 modül, 5 yol ve 7 araştırma yazısının tamamı taranır.
-
Prompt Güvenliği
Prompt injection, jailbreaking ve indirect injection saldırıları + savunma katmanları.
-
Prompt Injection Nedir?
Modelin neden 'ezilebilir' olduğunu, sistem promptu kavramını ve direct/indirect ayrımının temelini kuruyoruz.
-
Prompt Injection
OWASP LLM01'in tam anatomisi: prompt injection nedir, direct ve indirect varyantları nasıl çalışır, hangi kanaldan gelirler.
-
Doğrudan (Direct) Prompt Injection
… klasik PI saldırıları: 'önceki talimatları yoksay', system prompt sızdırma, JSON kaçırma.
-
Klasik Jailbreak Aileleri
DAN, persona injection, hipotetik çerçeveleme, format dönüşümü ve kademeli yaklaşım. Internet'in son 3 yılında en çok denenmiş PI varyantları.
-
Dolaylı (Indirect) Prompt Injection
Bu listenin en sinsi maddesi: saldırgan modelle hiç konuşmadan, dış içeriklerin (web/PDF/email/RAG) içine talimat gömerek saldırır.
-
Gerçek Dünyadan AI Güvenlik Vakaları
Tay, Sydney, Samsung, DAN, Copilot, Hugging Face pickle, Air Canada. Her vaka bir hikaye, her hikaye bir ders.
-
OWASP LLM Top 10
LLM uygulamalarının kendine özgü 10 zafiyet sınıfı. Ne, niye, nasıl savunulur — her madde için tek paragraflık özet.
-
Bir LLM Sana Cevap Verirken Ne Yapar?
Tek bir tur: token → embedding → attention (sezgi) → sampling → cevap. Her adımda 'burası niye saldırı yüzeyi?' notuyla.
-
MITRE ATLAS — AI İçin ATT&CK
ATT&CK ile aynı yapı, AI'a özgü taktikler. Kurumsal AI red-teaming'de OWASP ile birlikte nasıl kullanılır?
-
Sistem ve Mimari Savunma
Defense-in-depth'in en kritik halkası: system prompt hardening, agent sandboxing, least privilege, human-in-the-loop, audit logging.
-
Bir LLM Nasıl Doğar?
Pretraining → Fine-tuning → RLHF — üç ardışık aşama. Saldırgan her birine ayrı bir kapıdan vurur. Halüsinasyonun da nereden geldiğini göreceksin.
-
Output Handling ve Plugin Tasarımı
OWASP LLM02 + LLM07 derinlemesine: çıktıyı asla eval'e koyma, plugin scope, parametre validation, schema enforcement.
-
RAG Anatomisi: 5 Adımlı Pipeline
Embed → Store → Retrieve → Augment → Generate. Her adımın görevi, popüler vektör DB seçenekleri (Pinecone, Qdrant, Chroma, pgvector) ve güven sınırları haritası.
-
AI, ML, DL, LLM — Nedir Bunlar?
İç içe dört kavram. Hangisi neyin alt kümesi, niye karıştırılıyor, niye senin için önemli?
-
Bir LLM Uygulamasının Bileşenleri
İstemci → Gateway → Orchestrator → Model → Vektör DB → Tool'lar. Güven sınırları haritası ve her bileşenin saldırı yüzeyi.
-
STRIDE × ATLAS
Microsoft'un 1999'da yayımladığı STRIDE'ı AI sistemlerine genişletmek + MITRE ATLAS taktikleriyle çapraz haritalamak.
-
Agent Mimarisi: Düşün-Eyle-Gözlemle Döngüsü
Modern LLM agent'larının iç çalışma mantığı (ReAct loop), tool calling protokolü ve OWASP LLM07-LLM08 zafiyetlerine mimari giriş.
-
Chunking ve Retrieval Stratejileri
Chunk boyutu, overlap, top-K, hybrid search (BM25 + vector), reranking — her stratejinin saldırı ve savunma açısı.
-
Agent Güvenliği ve Yetki Kısıtlama
LLM08 (Excessive Agency) odaklı: tool whitelist, HITL, audit, Copilot vakasını mimari açıdan geriye dönük analiz.
-
Dataset ve Paket Tedarik Saldırıları
Typosquatting (AI/ML paketlerinde yaygın), hallucinated package → slopsquatting, dependency confusion ve açık dataset zehirlenmesi.
-
RAG Poisoning Derin Dalış
Zehirli doküman teknikleri (CSS, PDF metadata, ZIP, OCR adversarial), gerçek 2024 vakaları ve cross-tenant senaryosu.
-
Input Savunma Katmanı
Blocklist, normalizasyon, prompt classifier, rate-limit, kullanıcı bağlamı: modelin önüne gelen her girdi nasıl süzülür?
-
Model Çalma (LLM10) Savunması
Distillation hırsızlığı, model extraction saldırıları, çıktı watermarking, API-seviyesi rate-limit + anomaly detection ve hukuki sınırlar.
-
RAG Çevresinde Input/Output Guardrail'ları
Untrusted content tagging, grounding (cevabı yalnız retrieved belgelerden üretme), citation enforcement, output URL whitelist, indirect PI exfiltration savunması.
-
AI Gateway ve Policy Katmanı
Tüm AI trafiğini tek bir merkezden geçiren gateway pattern'i; rate-limit, auth, classifier, model yönlendirme, audit log. Endüstri standardı haline geliyor.
-
Prompt Defense
Tek bir kontrol yetmez. Input → Model → Output → Mimari halkalarının her birinde ayrı katmanlı savunma. Defense-in-depth bu yolun ders kitabıdır.
-
Pratik Threat Model: Bir RAG Asistanı
Hayali ama gerçekçi bir kurumsal RAG asistanını adım adım threat-model eden uygulamalı oda. Sistem ayrıştırma → tehdit bulma → kontrol atama.
-
Output Savunma Katmanı
Çıktıyı maskeleme, regex süzgeci, JSON schema doğrulama ve cevabı ikinci bir AI'a denetleten LLM judge mimarisi.
-
Modern Jailbreak Teknikleri
Crescendo, Many-shot, encoding bypass (base64/leet/rot13) ve GCG gibi otomatik adversarial suffix saldırıları — 2023-2025 dalgasının öne çıkanları.
-
Embedding Inversion, Cross-Tenant Sızıntı ve Retrieval Hijack
Vektör DB dump'ından metin geri çıkarma (vec2text), Carlini'nin training data extraction çalışması, membership inference ve retrieval hijack teknikleri.