Training Data Poisoning (Eğitim Verisi Zehirleme)
İngilizce: Training Data Poisoning
Modelin eğitim verisine kasıtlı kötü örnekler eklenmesi. OWASP LLM03.
Web'den scrape edilen veriye saldırgan kontrolüne sahip "honeypot" sayfalar ekler; model bunlardan eğitilince saldırganın "tetikleyici kelime"sine farklı davranır. Açık kaynak modellerin fine-tune sürecinde, lokal veri setleri üzerinde de yapılır. Tespit: data lineage, eğitim öncesi veri hash kontrolü.