Социальная сеть ВКонтакте запустила нейросеть для блокировки враждебных комментариев, которая доступна администраторам групп.
Социальная сеть ВКонтакте представила новую функцию для администраторов сообществ: автоматическое удаление «враждебных» комментариев. В основе фильтра лежит разработанная ею нейросеть.
Сейчас алгоритмы ВКонтакте умеют определять прямые угрозы, такие как пожелания смерти и обещания причинить вред здоровью. В будущем нейросеть научат распознавать и другие признаки нетерпимости, например травлю на национальной или религиозной почве.
Фильтр по умолчанию отключен, владельцы пабликов могут включить его в настройках сообщества. Там же они смогут увидеть отсеянные комментарии, восстановить любой из них или отправить автора агрессивного высказывания в бан.
Сейчас нейросеть правильно определяет угрозы в 80% случаев, и команда продолжает работать над её улучшением.