Новая модель автоматического обнаружения и фильтрации спама



Спам-это нежелательные сообщения, которые часто отправляются многим случайным пользователям в больших количествах. Эти сообщения могут содержать рекламу, а также фишинговые ссылки или вредоносные программы. Автоматическая фильтрация писем и идентификация спам-сообщений очень выгодны, так как они могут снизить риск фишинговых атак и облегчить пользователям навигацию по своим учетным записям.


За последние несколько лет компьютерные ученые разработали все более совершенные вычислительные модели для автоматического обнаружения спама. Однако для хорошей работы большинство этих моделей необходимо обучать на больших наборах данных электронной почты, которые были помечены людьми вручную.


Исследователи из Сингадского технологического института Лонавала в Индии недавно создали новую технику автоматического обнаружения спам-писем. Этот метод, представленный в статье, опубликованной в International Journal of Intelligent Robotics and Applications, может помочь повысить безопасность пользователей, а также помочь им просматривать нерелевантные или нежелательные электронные письма.


"Наша модель также снижает скорость обучения и приводит к большей эффективности классификации", - сказал TechXplore Викас Самартрао Кадам, один из исследователей, проводивших исследование. "В отличие от других моделей, она увеличивает скорость конвергенции обнаружения спама, достигая лучших результатов".


Модель, разработанная Кадамом и его коллегами, основана на многоцелевом выборе функций и адаптивной капсульной сети - новой и очень перспективной методике глубокого обучения. В отличие от других ранее разработанных методов, модель обучалась как на графических, так и на текстовых наборах данных.


"Наша модель вводит новый гибридный эвристический алгоритм и обеспечивает оптимальный выбор функций с многоцелевой функцией", - объяснил Кадам. "Наша работа подтверждает перспективность новых и улучшенных моделей обнаружения, основанных на алгоритмах глубокого обучения. Автоматическое обнаружение спама необходимо из-за его простоты."


Разработанная исследователями модель проста в реализации и может быть быстро обучена в течение коротких периодов времени. В первоначальных оценках Кадам и его коллеги обнаружили, что он может обнаруживать спам-письма с большей точностью, чем другие существующие методы.


"Обнаружение спама важно, поскольку оно может обеспечить справедливость для продавцов и сохранить доверие покупателя к интернет-магазинам", - сказал Кадам. "В отличие от других методов, он улучшает скорость обучения и эффективность классификации. Наша модель может улучшить качество жизни людей, которые получают большое количество писем, позволяя им беспрепятственно просматривать свою электронную почту и использовать свои учетные записи только для желаемых целей".


В будущем техника фильтрации спама, созданная Кадамом и его коллегами, может быть реализована в больших масштабах, повысив безопасность и эффективность почтовых сервисов. Примечательно, что модель может быть применена к широкому спектру существующих сервисов, включая Gmail, Yahoo mail и Outlook.


"Почти все исследователи представляют свои результаты на основе точности, точности и отзыва своих моделей, но мы считаем, что временная сложность моделей машинного обучения также должна рассматриваться как оценочная метрика", - сказал Кадам. "Некоторые исследователи показывают многообещающие результаты в процессе извлечения функций с использованием пакета слов, поскольку они утверждают, что заголовок электронной почты так же важен для обнаружения спама, как и содержимое тела. Таким образом, в будущем можно было бы рассмотреть возможность глубокого извлечения строки заголовка".


До сих пор новый метод фильтрации спама, разработанный этой исследовательской группой, достигал очень многообещающих результатов, поскольку он мог эффективно обнаруживать спам-письма с высокой точностью. Тем не менее, Кадам и его коллеги считают, что его скорость и точность могут быть улучшены в будущем.


"Безопасность систем обнаружения и фильтрации спама имеет решающее значение для достижения большей точности и надежных результатов, которые могут быть улучшены в будущем с помощью ансамблевого обучения", - добавил Кадам. "Частота ложных срабатываний многих моделей все еще выше, чем требуется, но в будущем она должна быть уменьшена до минимально возможного значения. Классификация спама в реальном времени очень необходима, так как большинство предлагаемых моделей плохо работают с данными в реальном времени".

Обсудить:

0 comments:

Всегда рады услышать ваше мнение!