Газета «Домашний Интернет»
Главная страница Архив номеров Контакты Карта сайта
«Лаборатория Касперского» запатентовала эффективную технологию борьбы с графическим спамом

«Лаборатория Касперского» сообщила об успешном патенто-вании в США передовой технологии обнаружения спама в растровых изображениях.

Спамеры часто распространяют свои сообщения в виде изображений с целью затруднить детектирование. Для обнаружения такого спама требуется сначала выделить его из картинки. Чтобы усложнить (детектирование еще больше, спамеры применяют прием зашум-ления фона изображения, используют «прыгающие» буквы и разбивают сообщение рамками и линиями.

Обычный подход к выделению текста из изображений — использование систем оптического распознавания символов (OCR). Однако они, как правило, ресурсоемки и не обеспечивают требуемой точности детектирования. Запатентованная технология гарантирует точное и быстрое выделение спама из изображений. Она устойчива к зашумлению и искажению, что значительно повышает уровень детектирования.

В основе технологии лежит вероятностно-статистический метод, согласно которому решение о том, содержит ли изображение текст, принимается на основании характера расположения вероятных графических образов слов и строк, а также содержания в них выявленных образов букв и слов.

Автору изобретения — руководителю группы развития антиспам-технологий «Лаборатории Касперского» Евгению Смирнову 27 апреля 2010 года патентное бюро США выдало на технологию 2 патента №№ 7706613 и 7706614. 4 мая 2010 года был получен еще один патент № 7711192 на усовершенствованный вариант технологии. В данном варианте оптимизировано выделение объектов, в результате чего они становятся лучше различимы, а также улучшена эффективность фильтрации обнаруженного спама.

«Машинные методы оптического распознавания требуют единообразия размеров и расположения выделяемых символов. В отличие от них наша технология работает с различными вариантами наклоненных или искаженных букв и слов, что повышает точность детектирования. Кроме того, запатентованный метод предлагает более высокую скорость обработки изображений», — говорит руководитель отдела по управлению интеллектуальной собственностью «Лаборатории Касперского» Надежда Кащенко.

Все новости номера »

Факты от iRobot'a
Когда впервые был изобретен CD, разработчики пытались определить для него объем и решили, что диск должен быть достаточно большим, чтобы вместить Девятую симфонию Бетховена, проигрываемую в любом темпе. А это примерно 72 минуты. 2(2) 2007
31 августа — День блоггера (ВlogDау). Цифра 3108 по очертаниям напоминает слово «Blog». 12(23) 2008
Имя поисковика Yahoo означает Yet Another Hierarchical Officious Oracle, что в переводе с английского «еще один иерархический исполнительный предсказатель». 2(2) 2007
Apple возглавила список ведущих торговцев музыкой, обойдя (наконец) Wal-Mart. По данным компании NPD, iTunes Store в начале текущего года захватил 19-процентную долю соответствующего рынка, оставив позади прежнего лидера Wal-Mart (15%) и всех остальных. 4(15) 2008
30 и 31 августа пройдет крупнейший российский компьютерный фестиваль Chaos Construction'08. Он объединяет специалистов в области программирования, графики, демосцены, информационной безопасности (CCHackAround), а также интересующихся электроникой и историей вычислительной техники (CC Antique). 8(19) 2008
Главная страница Архив номеров Контакты Карта сайта