Видеосервис Megogo начнет использовать нейросеть для распознавания запрещенного контента, сообщил «Ведомостям» гендиректор компании Виктор Чеканов.
Робот будет распознавать четыре группы нецензурных слов из списка Роскомнадзора и их производные, курение, алкоголь, секс. Программу планируется научить также замечать сцены насилия.
По словам Чеканова, нейросеть проанализирует 700 тыс. единиц контента и 35 тыс. тайтлов. Он указывает, что это превентивная мера для устранения возможных нарушений.
В основе робота два решения. Первое – Vosk – инструмент для распознавания речи с открытым исходным кодом. Компания его дорабатывает, потому что пока он может распознать части слов как матерные. Например, программа считает нецензурным словосочетание «не психуй». Второе решение – это система распознавания изображений с помощью нейросети.
Нейросеть пока обучают тестировщики. Megogo планирует продавать решение рынку в будущем, если оно будет успешно распознавать запрещенный контент.
Ранее Роскомнадзор составил административный протокол на Megogo за то, что компания поставила возрастную маркировку «16+», а не «18+» фильму «Никто не знает про секс», хотя в нем есть мат и секс. В момент выхода (2006 год) ему присвоили рейтинг «16+».
Ведомство объясняло, что производители и распространители информационной продукции сами должны классифицировать контент по федеральному закону «О защите детей от информации, причиняющей вред их здоровью и развитию», который вступил в силу с 1 сентября 2012 года.