Arama

Akademide Ara

35 oda, 14 modül, 5 yol ve 7 araştırma yazısının tamamı taranır.

"token smuggling" için 22 sonuç.
  1. Oda /oda/llm-nasil-calisir

    Bir LLM Sana Cevap Verirken Ne Yapar?

    Tek bir tur: token → embedding → attention (sezgi) → sampling → cevap. Her adımda 'burası niye saldırı yüzeyi?' notuyla.

  2. Oda /oda/jailbreak-teknikleri

    Klasik Jailbreak Aileleri

    DAN, persona injection, hipotetik çerçeveleme, format dönüşümü ve kademeli yaklaşım. Internet'in son 3 yılında en çok denenmiş PI varyantları.

  3. Oda /oda/input-savunma

    Input Savunma Katmanı

    Blocklist, normalizasyon, prompt classifier, rate-limit, kullanıcı bağlamı: modelin önüne gelen her girdi nasıl süzülür?

  4. Oda /oda/dogrudan-injection

    Doğrudan (Direct) Prompt Injection

    Saldırganın doğrudan sohbet penceresinden yazdığı klasik PI saldırıları: 'önceki talimatları yoksay', system prompt sızdırma, JSON kaçırma.

  5. Oda /oda/mimari-savunma

    Sistem ve Mimari Savunma

    Defense-in-depth'in en kritik halkası: system prompt hardening, agent sandboxing, least privilege, human-in-the-loop, audit logging.

  6. Oda /oda/output-savunma

    Output Savunma Katmanı

    Çıktıyı maskeleme, regex süzgeci, JSON schema doğrulama ve cevabı ikinci bir AI'a denetleten LLM judge mimarisi.

  7. Oda /oda/gateway-ve-policy

    AI Gateway ve Policy Katmanı

    Tüm AI trafiğini tek bir merkezden geçiren gateway pattern'i; rate-limit, auth, classifier, model yönlendirme, audit log. Endüstri standardı haline geliyor.

  8. Oda /oda/model-calma-savunmasi

    Model Çalma (LLM10) Savunması

    Distillation hırsızlığı, model extraction saldırıları, çıktı watermarking, API-seviyesi rate-limit + anomaly detection ve hukuki sınırlar.

  9. Oda /oda/risk-degerlendirme-pratigi

    Pratik Threat Model: Bir RAG Asistanı

    Hayali ama gerçekçi bir kurumsal RAG asistanını adım adım threat-model eden uygulamalı oda. Sistem ayrıştırma → tehdit bulma → kontrol atama.

  10. Oda /oda/chunking-ve-retrieval-stratejileri

    Chunking ve Retrieval Stratejileri

    Chunk boyutu, overlap, top-K, hybrid search (BM25 + vector), reranking — her stratejinin saldırı ve savunma açısı.

  11. Oda /oda/prompt-injection-temelleri

    Prompt Injection Nedir?

    Modelin neden 'ezilebilir' olduğunu, sistem promptu kavramını ve direct/indirect ayrımının temelini kuruyoruz.

  12. Oda /oda/dataset-ve-paket-saldirilari

    Dataset ve Paket Tedarik Saldırıları

    Typosquatting (AI/ML paketlerinde yaygın), hallucinated package → slopsquatting, dependency confusion ve açık dataset zehirlenmesi.

  13. Oda /oda/owasp-llm-top10

    OWASP LLM Top 10

    LLM uygulamalarının kendine özgü 10 zafiyet sınıfı. Ne, niye, nasıl savunulur — her madde için tek paragraflık özet.

  14. Oda /oda/llm-nasil-egitilir

    Bir LLM Nasıl Doğar?

    Pretraining → Fine-tuning → RLHF — üç ardışık aşama. Saldırgan her birine ayrı bir kapıdan vurur. Halüsinasyonun da nereden geldiğini göreceksin.

  15. Oda /oda/stride-x-atlas

    STRIDE × ATLAS

    Microsoft'un 1999'da yayımladığı STRIDE'ı AI sistemlerine genişletmek + MITRE ATLAS taktikleriyle çapraz haritalamak.

  16. Oda /oda/format-guvenligi-pickle-rce

    Format Güvenliği: Pickle RCE'den safetensors'e

    Python `pickle` formatının doğuştan RCE açığı, `torch.load()` zafiyeti ve sektörün geçtiği safetensors / GGUF / ONNX alternatifleri.

  17. Oda /oda/rag-anatomisi

    RAG Anatomisi: 5 Adımlı Pipeline

    Embed → Store → Retrieve → Augment → Generate. Her adımın görevi, popüler vektör DB seçenekleri (Pinecone, Qdrant, Chroma, pgvector) ve güven sınırları haritası.

  18. Oda /oda/agent-guvenligi-ve-yetki

    Agent Güvenliği ve Yetki Kısıtlama

    LLM08 (Excessive Agency) odaklı: tool whitelist, HITL, audit, Copilot vakasını mimari açıdan geriye dönük analiz.

  19. Oda /oda/hugging-face-ekosistemi

    Hugging Face Ekosistemi ve Riskleri

    Sektörün de-facto model deposunda yaşanan gerçek incident'lar (JFrog/Protect AI/ReversingLabs bulguları) ve platformun kendi tarama mekanizmaları.

  20. Oda /oda/modern-jailbreak-teknikleri

    Modern Jailbreak Teknikleri

    Crescendo, Many-shot, encoding bypass (base64/leet/rot13) ve GCG gibi otomatik adversarial suffix saldırıları — 2023-2025 dalgasının öne çıkanları.

  21. Oda /oda/embedding-inversion-ve-veri-sizintisi

    Embedding Inversion, Cross-Tenant Sızıntı ve Retrieval Hijack

    Vektör DB dump'ından metin geri çıkarma (vec2text), Carlini'nin training data extraction çalışması, membership inference ve retrieval hijack teknikleri.

  22. Oda /oda/embedding-ve-vektor-uzayi-guvenligi

    Embedding ve Vektör Uzayı Güvenliği

    Embedding modeli seçimi, cosine similarity manipülasyonu, boyut (dimensionality) etkisi ve embedding backdoor saldırılarına giriş.