Savunma

Guardrails (Korkuluklar)

İngilizce: Guardrails

LLM giriş/çıkışını filtreleyen kural ve kontrol katmanı.

NVIDIA NeMo Guardrails, Guardrails AI, Promptguard gibi araçlar bu sınıftadır. İki yön: input guardrail (kullanıcı promptunu filtreler/temizler), output guardrail (modelin cevabını PII, toxicity, schema validation için kontrol eder). LLM judge ile beraber kullanılır.