Mollom — это сервис по фильтрации различных форм спама из контента, сгенерированного пользователями: комментариев, постов на форумах и блогах, опросов, контактных и регистрационных форм. Определение спама основано не только на контенте, но и репутации и прошлой активности разместившего его пользователя. Алгоритм машинного обучения Mollom выполняет роль цифрового модератора 24×7 для более 40 тысяч сайтов, в том числе и очень крупных компаний.

Как это работает?

Процесс выглядит следующим образом:

  • Когда пользователь отправляет комментарий на сайт, происходит запрос к API Mollom.
  • Контент анализируется, если он оказывается спамом, то сайту сообщается, что необходимо его заблокировать, если же алгоритм не уверен на 100% — сайту советуют показать CAPTCHA, которую сервис также предоставляет.
  • После того, как CAPTCHA будет успешно заполнена, контент принимается. В большинстве случаев пользователи не будут ее видеть и контент будет приниматься сразу же.

Обнаружение спама является сложным балансом между отказом нормальному контенту и принятию спама.

Самообучение

Моллом обучаем — на пробившийся спам можно сказать — «вот этого я больше видеть не хочу» и указать одну из нижеследующих причин:

  • Сообщить о тексте, как о спаме или рекламе
  • Сообщение о тексте, как о непристойном или оскорбительном
  • Сообщить о тексте, как о неграмотном
  • Сообщить о тексте, как о нежелательном, дерзком или уводящим от темы

В дальнейшем mollom будет учитывать эти пожелания. Равно как и может обучаться самостоятельно, но его способы обучения все же загадка.

Есть и недостаток — судя по всему, возможности вытащить попавшее под нож анти-спам репрессий невинно убиенное сообщение нет, равно как и объяснить «mollom, ты не прав». В целом не проблема, но подозреваю, что ненароком убитый с жалобой нормальный комментарий может потом испортить немало крови новым пользователям. Хотя рад и ошибаться.

Читайте  Переключение языка ввода в Windows по Caps Lock

Установка и настройка в D6 и D7

Всё просто. Скачиваем и устанавливаем модуль mollom. Регистрируемся на сайте проекта. В разделе Site manager добавляем новый сайт. Берем данные из меню View keys и заносим их в соответствующие пункты настройки модуля на своем сайте.

Далее проводим первоначальную настройку модуля. Для D7 — admin/config/content/mollom/settings

Заканчиваем добавлением форм, в которых мы хотим, чтобы модуль работал. Для D7 admin/config/content/mollom/add

Что вы получаете?

Я сам много систем каптчи попробовал, но ни одна из них не давала такого результата. Этот маленький бложек в среднем посещают от 200 до 300 раз в сутки. Спам комментариев получается около 100 в день. Обычная каптча ранее отсеивала только 50% мусора. Mollom действительно позволяет отсеять остальные 49,99%. Пробиваются единицы.

Плюс к отличной системе определения спама — честным посетителям наконец-то не нужно угадывать замысловатые коды каптчи — просто зашел и откомментировал.

При написании были использованы следующие источники:

Архитектура Mollom

Mollom — ликвидация безграмотности

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

[Всего голосов: 0    Средний: 0/5]