Новости

Megogo внедрит нейросеть для поиска запрещенного контента

Видеосервис Megogo начнет использовать нейросеть для распознавания запрещенного контента, сообщил «Ведомостям» гендиректор компании Виктор Чеканов.

Робот будет распознавать четыре группы нецензурных слов из списка Роскомнадзора и их производные, курение, алкоголь, секс. Программу планируется научить также замечать сцены насилия.

По словам Чеканова, нейросеть проанализирует 700 тыс. единиц контента и 35 тыс. тайтлов. Он указывает, что это превентивная мера для устранения возможных нарушений.

В основе робота два решения. Первое – Vosk – инструмент для распознавания речи с открытым исходным кодом. Компания его дорабатывает, потому что пока он может распознать части слов как матерные. Например, программа считает нецензурным словосочетание «не психуй». Второе решение – это система распознавания изображений с помощью нейросети.

Нейросеть пока обучают тестировщики. Megogo планирует продавать решение рынку в будущем, если оно будет успешно распознавать запрещенный контент.

Ранее Роскомнадзор составил административный протокол на Megogo за то, что компания поставила возрастную маркировку «16+», а не «18+» фильму «Никто не знает про секс», хотя в нем есть мат и секс. В момент выхода (2006 год) ему присвоили рейтинг «16+».

Ведомство объясняло, что производители и распространители информационной продукции сами должны классифицировать контент по федеральному закону «О защите детей от информации, причиняющей вред их здоровью и развитию», который вступил в силу с 1 сентября 2012 года.