Saldırı

Training Data Poisoning (Eğitim Verisi Zehirleme)

İngilizce: Training Data Poisoning

Modelin eğitim verisine kasıtlı kötü örnekler eklenmesi. OWASP LLM03.

Web'den scrape edilen veriye saldırgan kontrolüne sahip "honeypot" sayfalar ekler; model bunlardan eğitilince saldırganın "tetikleyici kelime"sine farklı davranır. Açık kaynak modellerin fine-tune sürecinde, lokal veri setleri üzerinde de yapılır. Tespit: data lineage, eğitim öncesi veri hash kontrolü.