Öğrenme Yolu

Prompt Güvenliği

Prompt injection, jailbreaking ve indirect injection saldırıları + savunma katmanları.

  1. Prompt Injection

    OWASP LLM01'in tam anatomisi: prompt injection nedir, direct ve indirect varyantları nasıl çalışır, hangi kanaldan gelirler.

    3 oda 160 puan
    0%
  2. Jailbreaking

    Modelin RLHF ile çizilmiş 'kibar + güvenli' sınırını delip geçmek için kullanılan klasik ve modern jailbreak teknikleri.

    2 oda 160 puan
    0%
  3. Prompt Defense

    Tek bir kontrol yetmez. Input → Model → Output → Mimari halkalarının her birinde ayrı katmanlı savunma. Defense-in-depth bu yolun ders kitabıdır.

    3 oda 180 puan
    0%