Arama

Akademide Ara

35 oda, 14 modül, 5 yol ve 7 araştırma yazısının tamamı taranır.

"prompt injection" için 31 sonuç.

Yol /yol/prompt-guvenligi

Prompt Güvenliği

Prompt injection, jailbreaking ve indirect injection saldırıları + savunma katmanları.
Oda /oda/prompt-injection-temelleri

Prompt Injection Nedir?

Modelin neden 'ezilebilir' olduğunu, sistem promptu kavramını ve direct/indirect ayrımının temelini kuruyoruz.
Modül /modul/prompt-injection

Prompt Injection

OWASP LLM01'in tam anatomisi: prompt injection nedir, direct ve indirect varyantları nasıl çalışır, hangi kanaldan gelirler.
Oda /oda/dogrudan-injection

Doğrudan (Direct) Prompt Injection

… klasik PI saldırıları: 'önceki talimatları yoksay', system prompt sızdırma, JSON kaçırma.
Oda /oda/jailbreak-teknikleri

Klasik Jailbreak Aileleri

DAN, persona injection, hipotetik çerçeveleme, format dönüşümü ve kademeli yaklaşım. Internet'in son 3 yılında en çok denenmiş PI varyantları.
Oda /oda/indirect-prompt-injection

Dolaylı (Indirect) Prompt Injection

Bu listenin en sinsi maddesi: saldırgan modelle hiç konuşmadan, dış içeriklerin (web/PDF/email/RAG) içine talimat gömerek saldırır.
Oda /oda/gercek-dunya-vakalari

Gerçek Dünyadan AI Güvenlik Vakaları

Tay, Sydney, Samsung, DAN, Copilot, Hugging Face pickle, Air Canada. Her vaka bir hikaye, her hikaye bir ders.
Oda /oda/llm-nasil-calisir

Bir LLM Sana Cevap Verirken Ne Yapar?

Tek bir tur: token → embedding → attention (sezgi) → sampling → cevap. Her adımda 'burası niye saldırı yüzeyi?' notuyla.
Oda /oda/owasp-llm-top10

OWASP LLM Top 10

LLM uygulamalarının kendine özgü 10 zafiyet sınıfı. Ne, niye, nasıl savunulur — her madde için tek paragraflık özet.
Oda /oda/mitre-atlas

MITRE ATLAS — AI İçin ATT&CK

ATT&CK ile aynı yapı, AI'a özgü taktikler. Kurumsal AI red-teaming'de OWASP ile birlikte nasıl kullanılır?
Oda /oda/mimari-savunma

Sistem ve Mimari Savunma

Defense-in-depth'in en kritik halkası: system prompt hardening, agent sandboxing, least privilege, human-in-the-loop, audit logging.
Oda /oda/llm-nasil-egitilir

Bir LLM Nasıl Doğar?

Pretraining → Fine-tuning → RLHF — üç ardışık aşama. Saldırgan her birine ayrı bir kapıdan vurur. Halüsinasyonun da nereden geldiğini göreceksin.
Oda /oda/output-handling-ve-plugin

Output Handling ve Plugin Tasarımı

OWASP LLM02 + LLM07 derinlemesine: çıktıyı asla eval'e koyma, plugin scope, parametre validation, schema enforcement.
Oda /oda/rag-anatomisi

RAG Anatomisi: 5 Adımlı Pipeline

Embed → Store → Retrieve → Augment → Generate. Her adımın görevi, popüler vektör DB seçenekleri (Pinecone, Qdrant, Chroma, pgvector) ve güven sınırları haritası.
Oda /oda/ai-ml-dl-llm-nedir

AI, ML, DL, LLM — Nedir Bunlar?

İç içe dört kavram. Hangisi neyin alt kümesi, niye karıştırılıyor, niye senin için önemli?
Oda /oda/llm-uygulama-bilesenleri

Bir LLM Uygulamasının Bileşenleri

İstemci → Gateway → Orchestrator → Model → Vektör DB → Tool'lar. Güven sınırları haritası ve her bileşenin saldırı yüzeyi.
Oda /oda/stride-x-atlas

STRIDE × ATLAS

Microsoft'un 1999'da yayımladığı STRIDE'ı AI sistemlerine genişletmek + MITRE ATLAS taktikleriyle çapraz haritalamak.
Oda /oda/agent-mimarisi

Agent Mimarisi: Düşün-Eyle-Gözlemle Döngüsü

Modern LLM agent'larının iç çalışma mantığı (ReAct loop), tool calling protokolü ve OWASP LLM07-LLM08 zafiyetlerine mimari giriş.
Oda /oda/chunking-ve-retrieval-stratejileri

Chunking ve Retrieval Stratejileri

Chunk boyutu, overlap, top-K, hybrid search (BM25 + vector), reranking — her stratejinin saldırı ve savunma açısı.
Oda /oda/agent-guvenligi-ve-yetki

Agent Güvenliği ve Yetki Kısıtlama

LLM08 (Excessive Agency) odaklı: tool whitelist, HITL, audit, Copilot vakasını mimari açıdan geriye dönük analiz.
Oda /oda/dataset-ve-paket-saldirilari

Dataset ve Paket Tedarik Saldırıları

Typosquatting (AI/ML paketlerinde yaygın), hallucinated package → slopsquatting, dependency confusion ve açık dataset zehirlenmesi.
Oda /oda/rag-poisoning-derinlemesine

RAG Poisoning Derin Dalış

Zehirli doküman teknikleri (CSS, PDF metadata, ZIP, OCR adversarial), gerçek 2024 vakaları ve cross-tenant senaryosu.
Oda /oda/input-savunma

Input Savunma Katmanı

Blocklist, normalizasyon, prompt classifier, rate-limit, kullanıcı bağlamı: modelin önüne gelen her girdi nasıl süzülür?
Oda /oda/model-calma-savunmasi

Model Çalma (LLM10) Savunması

Distillation hırsızlığı, model extraction saldırıları, çıktı watermarking, API-seviyesi rate-limit + anomaly detection ve hukuki sınırlar.
Oda /oda/rag-input-output-guardrails

RAG Çevresinde Input/Output Guardrail'ları

Untrusted content tagging, grounding (cevabı yalnız retrieved belgelerden üretme), citation enforcement, output URL whitelist, indirect PI exfiltration savunması.
Oda /oda/gateway-ve-policy

AI Gateway ve Policy Katmanı

Tüm AI trafiğini tek bir merkezden geçiren gateway pattern'i; rate-limit, auth, classifier, model yönlendirme, audit log. Endüstri standardı haline geliyor.
Modül /modul/prompt-defense

Prompt Defense

Tek bir kontrol yetmez. Input → Model → Output → Mimari halkalarının her birinde ayrı katmanlı savunma. Defense-in-depth bu yolun ders kitabıdır.
Oda /oda/risk-degerlendirme-pratigi

Pratik Threat Model: Bir RAG Asistanı

Hayali ama gerçekçi bir kurumsal RAG asistanını adım adım threat-model eden uygulamalı oda. Sistem ayrıştırma → tehdit bulma → kontrol atama.
Oda /oda/output-savunma

Output Savunma Katmanı

Çıktıyı maskeleme, regex süzgeci, JSON schema doğrulama ve cevabı ikinci bir AI'a denetleten LLM judge mimarisi.
Oda /oda/modern-jailbreak-teknikleri

Modern Jailbreak Teknikleri

Crescendo, Many-shot, encoding bypass (base64/leet/rot13) ve GCG gibi otomatik adversarial suffix saldırıları — 2023-2025 dalgasının öne çıkanları.
Oda /oda/embedding-inversion-ve-veri-sizintisi

Embedding Inversion, Cross-Tenant Sızıntı ve Retrieval Hijack

Vektör DB dump'ından metin geri çıkarma (vec2text), Carlini'nin training data extraction çalışması, membership inference ve retrieval hijack teknikleri.

Prompt Güvenliği

Prompt Injection Nedir?

Prompt Injection

Doğrudan (Direct) Prompt Injection

Klasik Jailbreak Aileleri

Dolaylı (Indirect) Prompt Injection

Gerçek Dünyadan AI Güvenlik Vakaları

Bir LLM Sana Cevap Verirken Ne Yapar?

OWASP LLM Top 10

MITRE ATLAS — AI İçin ATT&CK

Sistem ve Mimari Savunma

Bir LLM Nasıl Doğar?

Output Handling ve Plugin Tasarımı

RAG Anatomisi: 5 Adımlı Pipeline

AI, ML, DL, LLM — Nedir Bunlar?

Bir LLM Uygulamasının Bileşenleri

STRIDE × ATLAS

Agent Mimarisi: Düşün-Eyle-Gözlemle Döngüsü

Chunking ve Retrieval Stratejileri

Agent Güvenliği ve Yetki Kısıtlama

Dataset ve Paket Tedarik Saldırıları

RAG Poisoning Derin Dalış

Input Savunma Katmanı

Model Çalma (LLM10) Savunması

RAG Çevresinde Input/Output Guardrail'ları

AI Gateway ve Policy Katmanı

Prompt Defense

Pratik Threat Model: Bir RAG Asistanı

Output Savunma Katmanı

Modern Jailbreak Teknikleri

Embedding Inversion, Cross-Tenant Sızıntı ve Retrieval Hijack