Saldırı

Prompt Injection (İstem Enjeksiyonu)

İngilizce: Prompt Injection

Kullanıcı girdisinde gizli bir talimatla, modelin asıl talimatını ezme saldırısı. OWASP LLM01.

LLM güvenliğinin "1 numaralı" zafiyeti. Klasik SQL injection'a benzer ama yamanması daha zordur çünkü model "talimat" ile "veri"yi ayırt edemez. Direct: kullanıcı doğrudan kötü prompt yazar. Indirect: bir belge, web sayfası veya e-posta üzerinden modele ulaşır. Karşı önlemleri tam değil; LLM Judge, structured output, ve least-privilege agent tasarımı en pratik savunmalardır.