Akademide Ara
35 oda, 14 modül, 5 yol ve 7 araştırma yazısının tamamı taranır.
-
STRIDE × ATLAS
Microsoft'un 1999'da yayımladığı STRIDE'ı AI sistemlerine genişletmek + MITRE ATLAS taktikleriyle çapraz haritalamak.
-
OWASP LLM Top 10
LLM uygulamalarının kendine özgü 10 zafiyet sınıfı. Ne, niye, nasıl savunulur — her madde için tek paragraflık özet.
-
Production Pattern'leri
OWASP LLM02 (Insecure Output Handling), LLM07 (Insecure Plugin Design) ve LLM08 (Excessive Agency)'nin saha pratiği. Üretim ortamı için gerçek desenler.
-
Güvenli AI Sistemleri
AI sistem mimarisi, threat modeling, OWASP LLM Top 10 ve MITRE ATLAS pratiği.
-
Prompt Injection
OWASP LLM01'in tam anatomisi: prompt injection nedir, direct ve indirect varyantları nasıl çalışır, hangi kanaldan gelirler.
-
Tehdit Manzarası
Sektörün konuştuğu iki temel referans (OWASP LLM Top 10 ve MITRE ATLAS) + son 10 yılın en öğretici AI güvenlik vakaları. Yolun geri kalanına çıkış kapısı.
-
AI Tedarik Zincirinin Haritası
Bir AI projesi neye, nereden, kimden bağımlıdır? Model dosyaları + dataset + paket + embedding modeli + plugin + vektör DB driver + bulut servisler — hepsi tedarik zinciri yüzeyidir.
-
Pratik Threat Model: Bir RAG Asistanı
Hayali ama gerçekçi bir kurumsal RAG asistanını adım adım threat-model eden uygulamalı oda. Sistem ayrıştırma → tehdit bulma → kontrol atama.
-
Agent Mimarisi: Düşün-Eyle-Gözlemle Döngüsü
… iç çalışma mantığı (ReAct loop), tool calling protokolü ve OWASP LLM07-LLM08 zafiyetlerine mimari giriş.
-
RAG Anatomisi: 5 Adımlı Pipeline
Embed → Store → Retrieve → Augment → Generate. Her adımın görevi, popüler vektör DB seçenekleri (Pinecone, Qdrant, Chroma, pgvector) ve güven sınırları haritası.
-
Dataset ve Paket Tedarik Saldırıları
Typosquatting (AI/ML paketlerinde yaygın), hallucinated package → slopsquatting, dependency confusion ve açık dataset zehirlenmesi.
-
Agent Güvenliği ve Yetki Kısıtlama
LLM08 (Excessive Agency) odaklı: tool whitelist, HITL, audit, Copilot vakasını mimari açıdan geriye dönük analiz.
-
Output Handling ve Plugin Tasarımı
OWASP LLM02 + LLM07 derinlemesine: çıktıyı asla eval'e koyma, plugin scope, parametre validation, schema enforcement.
-
Bir LLM Nasıl Doğar?
Pretraining → Fine-tuning → RLHF — üç ardışık aşama. Saldırgan her birine ayrı bir kapıdan vurur. Halüsinasyonun da nereden geldiğini göreceksin.
-
MITRE ATLAS — AI İçin ATT&CK
… aynı yapı, AI'a özgü taktikler. Kurumsal AI red-teaming'de OWASP ile birlikte nasıl kullanılır?
-
Gerçek Dünyadan AI Güvenlik Vakaları
Tay, Sydney, Samsung, DAN, Copilot, Hugging Face pickle, Air Canada. Her vaka bir hikaye, her hikaye bir ders.
-
Prompt Injection Nedir?
Modelin neden 'ezilebilir' olduğunu, sistem promptu kavramını ve direct/indirect ayrımının temelini kuruyoruz.
-
Model Çalma (LLM10) Savunması
Distillation hırsızlığı, model extraction saldırıları, çıktı watermarking, API-seviyesi rate-limit + anomaly detection ve hukuki sınırlar.
-
Bir LLM Uygulamasının Bileşenleri
İstemci → Gateway → Orchestrator → Model → Vektör DB → Tool'lar. Güven sınırları haritası ve her bileşenin saldırı yüzeyi.
-
Doğrudan (Direct) Prompt Injection
Saldırganın doğrudan sohbet penceresinden yazdığı klasik PI saldırıları: 'önceki talimatları yoksay', system prompt sızdırma, JSON kaçırma.
-
Dolaylı (Indirect) Prompt Injection
Bu listenin en sinsi maddesi: saldırgan modelle hiç konuşmadan, dış içeriklerin (web/PDF/email/RAG) içine talimat gömerek saldırır.
-
RAG Çevresinde Input/Output Guardrail'ları
Untrusted content tagging, grounding (cevabı yalnız retrieved belgelerden üretme), citation enforcement, output URL whitelist, indirect PI exfiltration savunması.
-
Bir LLM Sana Cevap Verirken Ne Yapar?
Tek bir tur: token → embedding → attention (sezgi) → sampling → cevap. Her adımda 'burası niye saldırı yüzeyi?' notuyla.
-
AI Gateway ve Policy Katmanı
Tüm AI trafiğini tek bir merkezden geçiren gateway pattern'i; rate-limit, auth, classifier, model yönlendirme, audit log. Endüstri standardı haline geliyor.
-
Input Savunma Katmanı
Blocklist, normalizasyon, prompt classifier, rate-limit, kullanıcı bağlamı: modelin önüne gelen her girdi nasıl süzülür?
-
Sistem ve Mimari Savunma
Defense-in-depth'in en kritik halkası: system prompt hardening, agent sandboxing, least privilege, human-in-the-loop, audit logging.
-
Model Tedarik Saldırıları: Backdoor ve Sleeper Agents
Fine-tuning aşamasında modele yerleştirilen arka kapılar, tetikleyici (trigger) tabanlı backdoor'lar ve Anthropic'in 2024'te yayımladığı 'Sleeper Agents' araştırması.
-
AI, ML, DL, LLM — Nedir Bunlar?
İç içe dört kavram. Hangisi neyin alt kümesi, niye karıştırılıyor, niye senin için önemli?
-
Temeller
AI/ML/DL/LLM nedir, bir LLM nasıl ortaya çıkıyor, sana cevap verirken arka planda ne yapıyor. Sözlük değil, sezgi modülü.
-
Output Savunma Katmanı
… JSON schema doğrulama ve cevabı ikinci bir AI'a denetleten LLM judge mimarisi.
-
Model İmzalama ve AIBOM
Klasik SBOM'un AI versiyonu olan AIBOM, Sigstore/Cosign ile model imzalama, in-toto attestation ve SLSA framework'ünün AI tedarik zincirine uyarlaması.
-
AI Temelleri
Yapay zeka ve makine öğrenmesinin sıfırdan temelleri. LLM nasıl çalışır, neden saldırı yüzeyidir?
-
Mimari
Bir LLM uygulamasının bileşenleri, güven sınırları, agent loop ve AI Gateway pattern'i. 'Güvenli sistem nedir?' sorusunun mimari cevabı.
-
Savunma ve Provenance
… e/Cosign), AIBOM (AI Bill of Materials), SLSA seviyeleri ve LLM10 (Model Theft) savunması: distillation hırsızlığı + watermarking + anomali tespiti.
-
Modern Jailbreak Teknikleri
Crescendo, Many-shot, encoding bypass (base64/leet/rot13) ve GCG gibi otomatik adversarial suffix saldırıları — 2023-2025 dalgasının öne çıkanları.
-
RAG Poisoning Derin Dalış
Zehirli doküman teknikleri (CSS, PDF metadata, ZIP, OCR adversarial), gerçek 2024 vakaları ve cross-tenant senaryosu.
-
Klasik Jailbreak Aileleri
DAN, persona injection, hipotetik çerçeveleme, format dönüşümü ve kademeli yaklaşım. Internet'in son 3 yılında en çok denenmiş PI varyantları.
-
Vektör DB Savunması
Tenant izolasyonu (row-level security), encryption at rest, kaynak provenance + imzalı chunk'lar, retrieval öncesi doğrulama.
-
Chunking ve Retrieval Stratejileri
Chunk boyutu, overlap, top-K, hybrid search (BM25 + vector), reranking — her stratejinin saldırı ve savunma açısı.
-
Embedding Inversion, Cross-Tenant Sızıntı ve Retrieval Hijack
Vektör DB dump'ından metin geri çıkarma (vec2text), Carlini'nin training data extraction çalışması, membership inference ve retrieval hijack teknikleri.
-
Format Güvenliği: Pickle RCE'den safetensors'e
Python `pickle` formatının doğuştan RCE açığı, `torch.load()` zafiyeti ve sektörün geçtiği safetensors / GGUF / ONNX alternatifleri.