Есть у меня в сети проектик один, который, кроме прочего, получает обращения граждан. Разумеется в форму заявок часто лезут всевозможные спам-боты. Я настроил ряд фильтров, которые умеют распознавать спам, и складывать его в отдельную табличку БД. Сейчас накопилось уже 1К+ записей. Думаю - грохнуть сразу... или отдать кому-нибудь для экспериментов.

Поля с реальными данными - спам-предложение (TEXT utf8), email (VARCHAR utf8). Остальные (регион, телефон, имя) - скорее всего фейк.