Arama

Akademide Ara

35 oda, 14 modül, 5 yol ve 7 araştırma yazısının tamamı taranır.

"prompt injection" için 31 sonuç.
  1. Yol /yol/prompt-guvenligi

    Prompt Güvenliği

    Prompt injection, jailbreaking ve indirect injection saldırıları + savunma katmanları.

  2. Oda /oda/prompt-injection-temelleri

    Prompt Injection Nedir?

    Modelin neden 'ezilebilir' olduğunu, sistem promptu kavramını ve direct/indirect ayrımının temelini kuruyoruz.

  3. Modül /modul/prompt-injection

    Prompt Injection

    OWASP LLM01'in tam anatomisi: prompt injection nedir, direct ve indirect varyantları nasıl çalışır, hangi kanaldan gelirler.

  4. Oda /oda/dogrudan-injection

    Doğrudan (Direct) Prompt Injection

    … klasik PI saldırıları: 'önceki talimatları yoksay', system prompt sızdırma, JSON kaçırma.

  5. Oda /oda/jailbreak-teknikleri

    Klasik Jailbreak Aileleri

    DAN, persona injection, hipotetik çerçeveleme, format dönüşümü ve kademeli yaklaşım. Internet'in son 3 yılında en çok denenmiş PI varyantları.

  6. Oda /oda/indirect-prompt-injection

    Dolaylı (Indirect) Prompt Injection

    Bu listenin en sinsi maddesi: saldırgan modelle hiç konuşmadan, dış içeriklerin (web/PDF/email/RAG) içine talimat gömerek saldırır.

  7. Oda /oda/gercek-dunya-vakalari

    Gerçek Dünyadan AI Güvenlik Vakaları

    Tay, Sydney, Samsung, DAN, Copilot, Hugging Face pickle, Air Canada. Her vaka bir hikaye, her hikaye bir ders.

  8. Oda /oda/owasp-llm-top10

    OWASP LLM Top 10

    LLM uygulamalarının kendine özgü 10 zafiyet sınıfı. Ne, niye, nasıl savunulur — her madde için tek paragraflık özet.

  9. Oda /oda/llm-nasil-calisir

    Bir LLM Sana Cevap Verirken Ne Yapar?

    Tek bir tur: token → embedding → attention (sezgi) → sampling → cevap. Her adımda 'burası niye saldırı yüzeyi?' notuyla.

  10. Oda /oda/mitre-atlas

    MITRE ATLAS — AI İçin ATT&CK

    ATT&CK ile aynı yapı, AI'a özgü taktikler. Kurumsal AI red-teaming'de OWASP ile birlikte nasıl kullanılır?

  11. Oda /oda/mimari-savunma

    Sistem ve Mimari Savunma

    Defense-in-depth'in en kritik halkası: system prompt hardening, agent sandboxing, least privilege, human-in-the-loop, audit logging.

  12. Oda /oda/llm-nasil-egitilir

    Bir LLM Nasıl Doğar?

    Pretraining → Fine-tuning → RLHF — üç ardışık aşama. Saldırgan her birine ayrı bir kapıdan vurur. Halüsinasyonun da nereden geldiğini göreceksin.

  13. Oda /oda/output-handling-ve-plugin

    Output Handling ve Plugin Tasarımı

    OWASP LLM02 + LLM07 derinlemesine: çıktıyı asla eval'e koyma, plugin scope, parametre validation, schema enforcement.

  14. Oda /oda/rag-anatomisi

    RAG Anatomisi: 5 Adımlı Pipeline

    Embed → Store → Retrieve → Augment → Generate. Her adımın görevi, popüler vektör DB seçenekleri (Pinecone, Qdrant, Chroma, pgvector) ve güven sınırları haritası.

  15. Oda /oda/ai-ml-dl-llm-nedir

    AI, ML, DL, LLM — Nedir Bunlar?

    İç içe dört kavram. Hangisi neyin alt kümesi, niye karıştırılıyor, niye senin için önemli?

  16. Oda /oda/llm-uygulama-bilesenleri

    Bir LLM Uygulamasının Bileşenleri

    İstemci → Gateway → Orchestrator → Model → Vektör DB → Tool'lar. Güven sınırları haritası ve her bileşenin saldırı yüzeyi.

  17. Oda /oda/stride-x-atlas

    STRIDE × ATLAS

    Microsoft'un 1999'da yayımladığı STRIDE'ı AI sistemlerine genişletmek + MITRE ATLAS taktikleriyle çapraz haritalamak.

  18. Oda /oda/agent-mimarisi

    Agent Mimarisi: Düşün-Eyle-Gözlemle Döngüsü

    Modern LLM agent'larının iç çalışma mantığı (ReAct loop), tool calling protokolü ve OWASP LLM07-LLM08 zafiyetlerine mimari giriş.

  19. Oda /oda/chunking-ve-retrieval-stratejileri

    Chunking ve Retrieval Stratejileri

    Chunk boyutu, overlap, top-K, hybrid search (BM25 + vector), reranking — her stratejinin saldırı ve savunma açısı.

  20. Oda /oda/agent-guvenligi-ve-yetki

    Agent Güvenliği ve Yetki Kısıtlama

    LLM08 (Excessive Agency) odaklı: tool whitelist, HITL, audit, Copilot vakasını mimari açıdan geriye dönük analiz.

  21. Oda /oda/dataset-ve-paket-saldirilari

    Dataset ve Paket Tedarik Saldırıları

    Typosquatting (AI/ML paketlerinde yaygın), hallucinated package → slopsquatting, dependency confusion ve açık dataset zehirlenmesi.

  22. Oda /oda/rag-poisoning-derinlemesine

    RAG Poisoning Derin Dalış

    Zehirli doküman teknikleri (CSS, PDF metadata, ZIP, OCR adversarial), gerçek 2024 vakaları ve cross-tenant senaryosu.

  23. Oda /oda/input-savunma

    Input Savunma Katmanı

    Blocklist, normalizasyon, prompt classifier, rate-limit, kullanıcı bağlamı: modelin önüne gelen her girdi nasıl süzülür?

  24. Oda /oda/model-calma-savunmasi

    Model Çalma (LLM10) Savunması

    Distillation hırsızlığı, model extraction saldırıları, çıktı watermarking, API-seviyesi rate-limit + anomaly detection ve hukuki sınırlar.

  25. Oda /oda/rag-input-output-guardrails

    RAG Çevresinde Input/Output Guardrail'ları

    Untrusted content tagging, grounding (cevabı yalnız retrieved belgelerden üretme), citation enforcement, output URL whitelist, indirect PI exfiltration savunması.

  26. Oda /oda/gateway-ve-policy

    AI Gateway ve Policy Katmanı

    Tüm AI trafiğini tek bir merkezden geçiren gateway pattern'i; rate-limit, auth, classifier, model yönlendirme, audit log. Endüstri standardı haline geliyor.

  27. Modül /modul/prompt-defense

    Prompt Defense

    Tek bir kontrol yetmez. Input → Model → Output → Mimari halkalarının her birinde ayrı katmanlı savunma. Defense-in-depth bu yolun ders kitabıdır.

  28. Oda /oda/risk-degerlendirme-pratigi

    Pratik Threat Model: Bir RAG Asistanı

    Hayali ama gerçekçi bir kurumsal RAG asistanını adım adım threat-model eden uygulamalı oda. Sistem ayrıştırma → tehdit bulma → kontrol atama.

  29. Oda /oda/output-savunma

    Output Savunma Katmanı

    Çıktıyı maskeleme, regex süzgeci, JSON schema doğrulama ve cevabı ikinci bir AI'a denetleten LLM judge mimarisi.

  30. Oda /oda/modern-jailbreak-teknikleri

    Modern Jailbreak Teknikleri

    Crescendo, Many-shot, encoding bypass (base64/leet/rot13) ve GCG gibi otomatik adversarial suffix saldırıları — 2023-2025 dalgasının öne çıkanları.

  31. Oda /oda/embedding-inversion-ve-veri-sizintisi

    Embedding Inversion, Cross-Tenant Sızıntı ve Retrieval Hijack

    Vektör DB dump'ından metin geri çıkarma (vec2text), Carlini'nin training data extraction çalışması, membership inference ve retrieval hijack teknikleri.