Arama

Akademide Ara

35 oda, 14 modül, 5 yol ve 7 araştırma yazısının tamamı taranır.

"token smuggling" için 22 sonuç.

Oda /oda/llm-nasil-calisir

Bir LLM Sana Cevap Verirken Ne Yapar?

Tek bir tur: token → embedding → attention (sezgi) → sampling → cevap. Her adımda 'burası niye saldırı yüzeyi?' notuyla.
Oda /oda/jailbreak-teknikleri

Klasik Jailbreak Aileleri

DAN, persona injection, hipotetik çerçeveleme, format dönüşümü ve kademeli yaklaşım. Internet'in son 3 yılında en çok denenmiş PI varyantları.
Oda /oda/input-savunma

Input Savunma Katmanı

Blocklist, normalizasyon, prompt classifier, rate-limit, kullanıcı bağlamı: modelin önüne gelen her girdi nasıl süzülür?
Oda /oda/dogrudan-injection

Doğrudan (Direct) Prompt Injection

Saldırganın doğrudan sohbet penceresinden yazdığı klasik PI saldırıları: 'önceki talimatları yoksay', system prompt sızdırma, JSON kaçırma.
Oda /oda/mimari-savunma

Sistem ve Mimari Savunma

Defense-in-depth'in en kritik halkası: system prompt hardening, agent sandboxing, least privilege, human-in-the-loop, audit logging.
Oda /oda/output-savunma

Output Savunma Katmanı

Çıktıyı maskeleme, regex süzgeci, JSON schema doğrulama ve cevabı ikinci bir AI'a denetleten LLM judge mimarisi.
Oda /oda/gateway-ve-policy

AI Gateway ve Policy Katmanı

Tüm AI trafiğini tek bir merkezden geçiren gateway pattern'i; rate-limit, auth, classifier, model yönlendirme, audit log. Endüstri standardı haline geliyor.
Oda /oda/model-calma-savunmasi

Model Çalma (LLM10) Savunması

Distillation hırsızlığı, model extraction saldırıları, çıktı watermarking, API-seviyesi rate-limit + anomaly detection ve hukuki sınırlar.
Oda /oda/risk-degerlendirme-pratigi

Pratik Threat Model: Bir RAG Asistanı

Hayali ama gerçekçi bir kurumsal RAG asistanını adım adım threat-model eden uygulamalı oda. Sistem ayrıştırma → tehdit bulma → kontrol atama.
Oda /oda/chunking-ve-retrieval-stratejileri

Chunking ve Retrieval Stratejileri

Chunk boyutu, overlap, top-K, hybrid search (BM25 + vector), reranking — her stratejinin saldırı ve savunma açısı.
Oda /oda/prompt-injection-temelleri

Prompt Injection Nedir?

Modelin neden 'ezilebilir' olduğunu, sistem promptu kavramını ve direct/indirect ayrımının temelini kuruyoruz.
Oda /oda/dataset-ve-paket-saldirilari

Dataset ve Paket Tedarik Saldırıları

Typosquatting (AI/ML paketlerinde yaygın), hallucinated package → slopsquatting, dependency confusion ve açık dataset zehirlenmesi.
Oda /oda/owasp-llm-top10

OWASP LLM Top 10

LLM uygulamalarının kendine özgü 10 zafiyet sınıfı. Ne, niye, nasıl savunulur — her madde için tek paragraflık özet.
Oda /oda/llm-nasil-egitilir

Bir LLM Nasıl Doğar?

Pretraining → Fine-tuning → RLHF — üç ardışık aşama. Saldırgan her birine ayrı bir kapıdan vurur. Halüsinasyonun da nereden geldiğini göreceksin.
Oda /oda/stride-x-atlas

STRIDE × ATLAS

Microsoft'un 1999'da yayımladığı STRIDE'ı AI sistemlerine genişletmek + MITRE ATLAS taktikleriyle çapraz haritalamak.
Oda /oda/format-guvenligi-pickle-rce

Format Güvenliği: Pickle RCE'den safetensors'e

Python `pickle` formatının doğuştan RCE açığı, `torch.load()` zafiyeti ve sektörün geçtiği safetensors / GGUF / ONNX alternatifleri.
Oda /oda/rag-anatomisi

RAG Anatomisi: 5 Adımlı Pipeline

Embed → Store → Retrieve → Augment → Generate. Her adımın görevi, popüler vektör DB seçenekleri (Pinecone, Qdrant, Chroma, pgvector) ve güven sınırları haritası.
Oda /oda/agent-guvenligi-ve-yetki

Agent Güvenliği ve Yetki Kısıtlama

LLM08 (Excessive Agency) odaklı: tool whitelist, HITL, audit, Copilot vakasını mimari açıdan geriye dönük analiz.
Oda /oda/hugging-face-ekosistemi

Hugging Face Ekosistemi ve Riskleri

Sektörün de-facto model deposunda yaşanan gerçek incident'lar (JFrog/Protect AI/ReversingLabs bulguları) ve platformun kendi tarama mekanizmaları.
Oda /oda/modern-jailbreak-teknikleri

Modern Jailbreak Teknikleri

Crescendo, Many-shot, encoding bypass (base64/leet/rot13) ve GCG gibi otomatik adversarial suffix saldırıları — 2023-2025 dalgasının öne çıkanları.
Oda /oda/embedding-inversion-ve-veri-sizintisi

Embedding Inversion, Cross-Tenant Sızıntı ve Retrieval Hijack

Vektör DB dump'ından metin geri çıkarma (vec2text), Carlini'nin training data extraction çalışması, membership inference ve retrieval hijack teknikleri.
Oda /oda/embedding-ve-vektor-uzayi-guvenligi

Embedding ve Vektör Uzayı Güvenliği

Embedding modeli seçimi, cosine similarity manipülasyonu, boyut (dimensionality) etkisi ve embedding backdoor saldırılarına giriş.

Bir LLM Sana Cevap Verirken Ne Yapar?

Klasik Jailbreak Aileleri

Input Savunma Katmanı

Doğrudan (Direct) Prompt Injection

Sistem ve Mimari Savunma

Output Savunma Katmanı

AI Gateway ve Policy Katmanı

Model Çalma (LLM10) Savunması

Pratik Threat Model: Bir RAG Asistanı

Chunking ve Retrieval Stratejileri

Prompt Injection Nedir?

Dataset ve Paket Tedarik Saldırıları

OWASP LLM Top 10

Bir LLM Nasıl Doğar?

STRIDE × ATLAS

Format Güvenliği: Pickle RCE'den safetensors'e

RAG Anatomisi: 5 Adımlı Pipeline

Agent Güvenliği ve Yetki Kısıtlama

Hugging Face Ekosistemi ve Riskleri

Modern Jailbreak Teknikleri

Embedding Inversion, Cross-Tenant Sızıntı ve Retrieval Hijack

Embedding ve Vektör Uzayı Güvenliği