Öğrenme Yolu

Prompt Güvenliği

Prompt injection, jailbreaking ve indirect injection saldırıları + savunma katmanları.

Prompt Injection

OWASP LLM01'in tam anatomisi: prompt injection nedir, direct ve indirect varyantları nasıl çalışır, hangi kanaldan gelirler.

3 oda 160 puan

0%
Jailbreaking

Modelin RLHF ile çizilmiş 'kibar + güvenli' sınırını delip geçmek için kullanılan klasik ve modern jailbreak teknikleri.

2 oda 160 puan

0%
Prompt Defense

Tek bir kontrol yetmez. Input → Model → Output → Mimari halkalarının her birinde ayrı katmanlı savunma. Defense-in-depth bu yolun ders kitabıdır.

3 oda 180 puan

0%