Prompt injection, jailbreaking ve indirect injection saldırıları + savunma katmanları.
OWASP LLM01'in tam anatomisi: prompt injection nedir, direct ve indirect varyantları nasıl çalışır, hangi kanaldan gelirler.
Modelin RLHF ile çizilmiş 'kibar + güvenli' sınırını delip geçmek için kullanılan klasik ve modern jailbreak teknikleri.
Tek bir kontrol yetmez. Input → Model → Output → Mimari halkalarının her birinde ayrı katmanlı savunma. Defense-in-depth bu yolun ders kitabıdır.