Спам в сети: это что такое простыми словами

Содержание

Что такое спам и чем он грозит?

Обзоры

ITC.UA
ITC.UA

Если вы когда-либо работали с электронной почтой, вам знакомо такое неприятное явление, как спам – массовая рассылка рекламных сообщений, проводящаяся без согласия получателя. Обычно она осуществляется не централизованно, с одного сервера, а с помощью так называемой спамерской сети, одновременно со множества компьютеров, подключенных к Интернету. Причем владельцу подобного ПК совершенно необязательно знать, что его рабочая станция является распространителем спама. Многие пользователи не придают нежелательной почте особого значения: подумаешь, пришло рекламное письмо, удаляем – и готово.

Веб-интерфейс Gmail. С помощью кнопки Report Spam можно добавить письмо в базу антиспам-фильтра, одновременно переместив его в специальную папку

Однако не все так просто, как кажется. Во-первых, подобные письма часто содержат вирусы (обычно это так называемые боты, которые включают ваш компьютер в существующую спамерскую сеть, что, в свою очередь, может привести к его попаданию в черный список). Во-вторых, спам-рассылки генерируют огромный трафик, создавая таким образом весьма серьезную нагрузку на сетевые ресурсы. Казалось бы, размер одного письма невелик, однако представьте, что подобные послания рассылаются миллионами экземпляров, а это уже серьезно тормозит работу Интернета и вынуждает оплачивать лишний трафик, особенно если ваш компьютер является ботом в спамерской сети. В-третьих, в спам-рассылках часто встречаются мошеннические письма. Среди них выделяют два самых распространенных типа – «нигерийские письма» и фишинг. Первый так назван по причине большого распространения в Нигерии и других государствах африканского континента. Обычно в этих письмах адресата просят помочь в осуществлении многомиллионной операции, например получении наследства от богатого дядюшки, ссылаясь на различные трудности в родной стране. От вас же требуется всего ничего – дать небольшую взятку чиновнику или открыть счет в банке и положить на него определенную сумму и тому подобные вещи. Разумеется, в любом случае обещанных денег жертва не увидит, поскольку их попросту нет. Название второго типа мошенничества – фишинг – произошло от английского fishing, т. е. «рыбалка». Его цель – выманить у пользователей конфиденциальную информацию о банковских счетах, номерах кредитных карт, паролях и т. д. Работает это следующим образом: вам приходит письмо якобы от администрации банка с просьбой в ближайшее время подтвердить свои данные, иначе ваш счет может быть заблокирован. Также в нем приводится адрес ресурса, где нужно заполнить некую онлайн-форму, в которой, среди прочих, есть и поля, необходимые мошенникам. Его оформление часто бывает выполнено в стиле реального сайта вашего банка, а адрес (название домена) может отличаться всего одной-двумя буквами. Так что при получении подобной корреспонденции следует быть предельно внимательным.

Зміст

  • 1 Базы адресов и как туда не попасть
  • 2 Как избежать спамерских рассылок
  • 3 И напоследок
  • 4 Происхождение термина СПАМ
  • 5 Фильтр Байеса

Базы адресов и как туда не попасть

Настройки антиспам-модуля в популярном почтовике Thunderbird

Понятное дело, чтобы отправить письмо, спамер должен знать адрес вашей электронной почты. Однако это не такая уж и сложная задача, как кажется. Основной способ – использование так называемых краулеров (интернет-ботов), наподобие тех, что применяются поисковыми системами. Они автоматически просматривают веб-страницы, переходя по встречающимся на них ссылкам, и ищут находящиеся в тексте адреса. А поскольку очень многие посещают различные блоги, форумы или же просто имеют домашние странички, где указывают свой e-mail в открытом виде, то их адрес с большой вероятностью попадет в спамерскую базу, которая к тому же может быть впоследствии несколько раз перепродана. В результате вы будете все чаще и чаще получать ценные предложения обрести наследство в Нигерии, купить оптом таблетки на все случаи жизни, посетить очень нужные семинары «Гербалайф», увеличить пенис и скачать все порно из Интернета. Чтобы этого не произошло, существуют маленькие хитрости. Во-первых, не всегда обязательно указывать свой основной адрес, если вам, к примеру, необходимо получить на него лишь пару писем: можно создать почтовый ящик на бесплатном сервисе, благо их сейчас хватает, или же воспользоваться временным почтовым ящиком, коих тоже предостаточно. Если же вам позарез нужно оставить именно свой основной адрес, его легко зашифровать. Как правило, краулеры ищут в текстах веб-страниц конструкции типа [email protected], и если его немного изменить (например, на myname(а)mydomain.com), то есть вероятность, что бот его пропустит. Для надежности можно попробовать более существенно переделать адрес, чтобы в результате получить нечто наподобие myname[песик]mydomain[тчк]com. Человек без труда «расшифрует» e-mail, а вот не слишком умный бот – вряд ли. Если же очень хочется, чтобы адрес все-таки выглядел правильно, но при этом не был распознан ботом, можно воспользоваться заменой текста с e-mail на рисунок с ним же, однако здесь есть небольшое неудобство – адрес нельзя будет скопировать в буфер обмена и придется вводить вручную. В принципе несложный JavaScript способен решить и такую проблему, однако углубляться в эту тему мы не станем, к тому же существует множество сервисов, помогающих создавать как картинки с адресом, так и «безопасные ссылки» на них. Однако иногда спамерам вовсе не нужно знать ваш e-mail: письма просто рассылаются по автоматически сгенерированным адресам популярных почтовых служб (например, [имя]@gmail.com) или крупных компаний ([имя]@microsoft.com). В этом случае [имя] является сгенерированным набором символов, одним из которых может оказаться и реальный адрес. И еще – многие спамерские сети будут очень рады получить от вас ответ типа «отстаньте от меня наконец…», тогда адрес пометят как «активный» и поток спама с большой вероятностью сильно увеличится, поэтому писать спамерам не стоит.

Как избежать спамерских рассылок

Веб-интерфейс для настроек фильтра Байеса, реализованный в виде дополнения к почтовому клиенту

Перво-наперво не следует оставлять свой адрес электронной почты на различного рода публичных ресурсах или хотя бы пользоваться советами из предыдущего раздела. Если уж на ваш адрес начала приходить нежелательная корреспонденция, то на помощь придут спам-фильтры. Это программы, или же модули, входящие в состав почтовых клиентов, которые по тем или иным признакам выявляют спамерские письма и поступают с ними согласно заданным правилам. Для определения «спам/не спам» используются три основных способа. Самый распространенный – это анализ содержимого письма и сравнение его с известным спамом. Разумеется, для успешной работы такого фильтра нужно иметь заранее собранную коллекцию спамерского «творчества», и чем эта коллекция больше, тем лучше, эффективнее будет работать фильтр. Подобная система применяется популярной службой Gmail, которая ежедневно обрабатывает миллионы различных сообщений, и каждый раз, когда пользователь нажимает кнопку Пожаловаться на спам, нежелательное послание попадает в базу фильтра. Учитывая огромную клиентскую базу Gmail, недостатка в «обучающих материалах» она не испытывает. Следующий по популярности способ – анализ IP-адреса компьютера, с которого получено письмо, и сравнение его с черным списком. Информацию об этом можно получить через службу DNS (Domain Name Service), отсюда и название подобных списков – DNSBL (DNS Black List). К сожалению, данный метод не особо эффективен, так как спамеры находят новые серверы для своих целей быстрее, чем их успевают заносить в черные списки. Кроме черных, существуют еще и так называемые серые списки. Они составляются на основе анализа «поведения» ПО, предназначенного для рассылки спама, поскольку поведение почтовых серверов отличается от такового у спам-серверов (к примеру, подобные программы не отправляют повторно сообщение при возникновении ошибки). Обычно все ранее неизвестные SMTP-серверы считаются серыми. Почта с них не принимается, но и не отклоняется окончательно – им возвращается код временной ошибки. В случае если отправитель повторяет попытку через определенный период, сервер вносится в белый список. Таким образом, нормальные письма не теряются, а лишь доставляются с некоторой задержкой. Этот метод в настоящее время достаточно эффективен, причем риск потерять важную почту минимален. Однако его тоже нельзя назвать безупречным. Третий способ отсеивания спама заключается в получении подтверждений от отправителя. То есть по приходу письма с определенного адреса в ответ высылается запрос с просьбой подтвердить отправку. Затем, если сервер получает подтверждение, адрес заносится в белый список и в дальнейшем не проверяется. Основной недостаток данного способа заключается в невозможности работать полностью автоматически, без участия человека, к тому же он резко снижает оперативность доставки писем и создает определенные неудобства отправителям. Кроме вышеописанных основных методов, есть множество других: отказ в приеме корреспонденции с неправильным обратным адресом (письма из несуществующих доменов), анализ заголовков письма, системы определения признаков массовости сообщения и прочие. К сожалению, на данный момент нет программ, которые бы позволяли фильтровать спам со 100%-ной точностью.

И напоследок

Хотя электронная почта в настоящий момент является основным источником спама, в последнее время все большую популярность приобретают рекламные рассылки с помощью систем обмена мгновенными сообщениями, в первую очередь ICQ, а также рекламные сообщения на различных форумах и блогах. Возможно, вскоре мы подробнее расскажем и об этом виде недобросовестной рекламы и как с ним бороться.

Происхождение термина СПАМ

Само название «спам» (англ. SPAM) произошло от мясных консервов компании Hormel Foods «SPiced hAM» («острая ветчина») – острого колбасного фарша из свинины. По одной из версий, после Второй мировой войны остались огромные запасы таких консервов, предназначенных для американских солдат. Чтобы сбыть свою продукцию не первой свежести, фирма Hormel Foods провела первую в своем роде рекламную кампанию. Слово SPAM было повсюду: на витринах магазинов, автобусах и трамваях, фасадах домов и газетных страницах. Реклама консервов SPAM непрерывно транслировалась по радио. В общем, от нее не было возможности скрыться – она везде бросалась в глаза и звучала из всех приемников. По другой версии, термин «спам» ведет свое происхождение от старого (1972 года) скетча английской комик-группы Monty Python, в котором посетители ресторанчика при попытке сделать заказ вынуждены слушать хор викингов, воспевающий эти мясные консервы.

Фильтр Байеса

Английский математик Томас Байес жил в XVIII веке и понятия не имел об электронной почте, однако он сформулировал одну из основополагающих в элементарной теории вероятности теорему, которая и используется в наиболее эффективном алгоритме анализа содержимого письма. Формула, описывающая теорему, довольно сложна, но ее суть заключается в том, что вероятность события может быть довольно точно вычислена, если собрана статистика его совершения в прошлом. То есть если из 10 писем 8 содержали фразу «продам помидоры оптом» и являлись спамом, то и следующее с этими словами с большой долей вероятности окажется таковым. Но как оценить эту долю? Для начала нам надо иметь набор «плохих» писем и «хороших». Затем проанализировать их и выяснить, какие слова и словосочетания попадаются в «хороших» письмах и насколько часто, аналогично поступив со спамом. И в тех и в других примерно с одинаковой частотой встречаются общеупотребительные слова, наличие которых ни о чем нам не говорит. Присвоим им нейтральную оценку «уровня спама», например 0,5. Далее мы видим, что фраза «продам помидоры оптом» была замечена в 8 письмах из 10, и присваиваем ей оценку 0,8, а фраза «Привет, дружище» – в 9 из 10 хороших писем и 1 раз в спаме, значит, ее оценка 0,1. Затем с помощью специальной формулы вычисляется суммарный рейтинг каждого нового письма, и на основе пользовательских настроек отсекается поток писем, оценка которых превышает заданную величину, например 0,9. На сегодняшний день фильтрация спама байесовскими фильтрами выглядит наиболее привлекательной по сравнению с другими имеющимися методами. В частности, они включены в такие популярные почтовые клиенты, как The Bat! и Thunderbird.

Как бороться со спамом в электронной почте: 5 проверенных методов

Полностью искоренить спам, пожалуй, невозможно — разве что вы перестанете пользоваться Интернетом. Спам-фильтры в почтовых клиентах хоть и спасают от вредоносных писем, но работают не всегда: то считают подозрительными важные письма, то, наоборот, отправляют нежелательную почту во «Входящие». Мы собрали 5 методов борьбы со спамом, которые помогут очистить ваш почтовый ящик.

Что такое спам или нежелательная почта? Это массовая рассылка навязчивых электронных писем, которые обычно содержат рекламу или предложение услуг. При этом спам может быть как безобидным (например, ежедневные новости онлайн-портала или рассылка о скидках в интернет-магазине, на которую вы не подписывались), так и опасным (письма со ссылками на фишинговые сайты или вредоносными вложениями). Тем не менее, у всех писем, которые можно назвать спамом, есть одно общее качество — вы не хотите их получать.

Какой же должна быть защита от спама? Как мы уже писали выше, одних только почтовых фильтров может быть недостаточно. Посмотрим, как ещё можно избавить свой почтовый ящик от мусора.

1. Обучайте свой спам-фильтр

Попробуйте не просто удалять нежелательные письма из папки «Входящие», а всегда сообщать почтовому клиенту, что они являются спамом. Например, в Gmail это можно сделать буквально парой кликов, выделив письмо и нажав на значок «В спам».

Похожая функциональность обычно предусмотрена и в других клиентах электронной почты. Также просматривайте время от времени папку со спамом в поисках сообщений, которые на самом деле им не являются, и сообщайте об ошибках (в Gmail для этого есть кнопка «Не спам»). Так вы сможете лучше «натренировать» спам-фильтр в вашей почте.

2. Никогда не отвечайте на спам

Если вы видите, что письмо явно нежелательное, — не открывайте его. Если же вы открыли письмо и поняли, что это спам, сразу же закройте его. Ни в коем случае не нажимайте на ссылки или кнопки, не загружайте вложенные файлы из сообщений от подозрительных отправителей — в них могут содержаться вредоносные программы, которые крадут ваши личные данные и подвергают угрозе ваш компьютер. Будьте внимательны, такие письма могут маскироваться под важные, например уведомления от крупных банков или интернет-магазинов.

Как же отличить действительно важное письмо от опасного спама? Первый звоночек подозрения должен зазвенеть, если у вас требуют деньги под каким-либо предлогом.

Чтобы проверить письмо:

1. Посмотрите на адрес отправителя. Часто фишинговые письма отправляются с адресов, похожих на настоящие сайты известных компаний. Важно уметь отличать реальные адреса от подделок: например, google-web.site — это явно не домен Google, а info-mail.ru.com никак не относится к компании Mail.ru. Порой от настоящего сайта адрес отличается только доменной зоной, как в примере на картинке ниже. А иногда даже можно подделать и доменнную зону.

2. Если в письме есть ссылка, похожая на вполне обычный и знакомый вам сайт — наведите на неё (но не нажимайте!) и посмотрите, куда она ведёт. В Google Chrome адрес при наведении отображается в левом нижнем углу. Злоумышленники иногда под видом одной ссылки маскируют другую.

Не отвечайте на подобное письмо, даже если у вас плохое настроение и хочется высказать отправителю всё, что вы о нём думаете. Поверьте, это далеко не лучший способ бороться со спамерами. Так вы только покажете им, что обращаете внимание на такие письма, и нежелательной почты может стать ещё больше. Если спам пришёл от друга или коллеги, немедленно свяжитесь с ним по другому каналу связи (например по телефону) и сообщите, что его взломали.

3. Заведите отдельный ящик для личных писем

Спам в Интернете работает по простой схеме: чем больше сайтов знают ваш адрес электронной почты, тем больше нежелательных писем вы получите. Лучше всего завести отдельный e-mail для регистраций на разных интернет-ресурсах, а свой личный адрес доверять только знакомым людям и проверенным сайтам.

Спамеры часто составляют списки электронных адресов, просто перебирая популярные имена, фамилии, словосочетания и подставляя к ним окончания известных почтовых клиентов (например @gmail.com, @yandex.ru, @mail.ru). Чтобы минимизировать шансы попадания вашего ящика в подобную базу, лучше всего зарегистрировать личный домен, подключить к нему почту и получить уникальный e-mail — скажем, [email protected]. В REG.RU при регистрации домена вы можете бесплатно подключить почтовый клиент от Яндекс или Mail.ru.

4. Подключите стороннюю защиту от спама

В Сети можно найти программы и расширения, специально заточенные на защиту от спама и справляющиеся со своей работой лучше, чем стандартные спам-фильтры. Например, если у вас есть почта на личном домене, в REG.RU вы можете подключить услугу расширенной защиты от спама, причём домен может быть зарегистрирован у любого регистратора.

5. Не публикуйте личный адрес в общедоступных местах

Если у вас есть личный сайт или страница на популярном онлайн-ресурсе, лучше не указывайте на них свой e-mail. Многие спамеры используют программы, которые автоматически посещают веб-сайты и ищут на них адреса электронной почты.

В соцсетях или на форумах обычно предусмотрена возможность скрыть свой e-mail от посторонних. С личным сайтом дело немного сложнее, особенно если вам важно оставить свои контакты для связи. Даже если вы спрячете e-mail под кнопкой, это вряд ли поможет: адрес всё равно можно найти в html-коде. Один из способов скрыть свою почту на веб-странице — создать контактную форму и отправлять данные с неё в CGI-программу, которая перешлёт обращение на ваш e-mail.

⌘⌘⌘

Надеемся, мы убедили вас не пренебрегать безопасностью личной почты. Если вы знаете другие действенные способы борьбы со спамом, делитесь ими в комментариях.

Спам в веб-формах: что это такое и как его предотвратить

За последние 25–30 лет Интернет сильно изменился. Мы перешли с медленных проводных соединений на высокоскоростные соединения Wi-Fi, а доступные инструменты сделали работу в Интернете гораздо более удобной и быстрый поиск информации, которую мы ищем. Интернет также оказал большое влияние на предприятия всех типов, поскольку возможности онлайн-маркетинга упростили для предприятий доступ и даже непосредственное взаимодействие со своими клиентами.

Однако есть одна проблема, которая существует с тех пор, как люди используют Интернет, — спам. Спам существует во многих формах, включая спам-письма, прямые сообщения, комментарии и сообщения в социальных сетях. Одним из видов спама, который особенно опасен для бизнеса, является формальный спам. Многие предприятия и учреждения имеют контактные формы на своих веб-сайтах, чтобы посетители могли оставлять комментарии, подписываться на информационные бюллетени и отправлять запросы на свои услуги. Эти контактные формы могут стать мишенью для спамеров и спам-ботов, что приведет к десяткам или даже сотням спам-форм в вашем почтовом ящике.

Отправка спам-форм раздражает, потому что они могут исказить ваши истинные числа отправленных форм и похоронить законные отправленные формы. В этом руководстве мы объясним, что такое спам в форме и что вы можете сделать, чтобы спам не завладел отправленными вами формами. Работа с профессиональным веб-дизайнером, таким как Proceed Innovative, может помочь вам выявить проблемы со спамом в формах и получить предложения о том, как вы можете его предотвратить.

Что такое спам форм?

Спам с формами — это отправка форм веб-сайта мошенниками или спам-ботами со злым умыслом. Информация в этих формах является ложной и может содержать оскорбительные выражения, рекламу других веб-сайтов или ссылки на фишинговые веб-сайты и сайты, загружающие вредоносное ПО. Есть несколько причин, по которым мошенники рассылают спам на веб-сайты, включая распространение вредоносных программ, кражу личной информации, размещение невидимых ссылок и даже захват контроля над веб-сайтом.

Как делается спам?

Спам может распространяться пользователями вручную, а также спам-ботами, запрограммированными на поиск и атаку уязвимостей веб-сайтов.

  • Спам вручную: Спам вручную — это когда люди вручную заполняют и отправляют веб-формы с ложной информацией и вредоносными ссылками. Во многих случаях ручные спамеры пытаются создать ссылки на определенный веб-сайт, но они также могут распространять вредоносное ПО и ссылки на вредоносные веб-сайты. Очень трудно остановить ручных спамеров, потому что они могут обойти многие меры по борьбе со спамом, такие как CAPTCHA.
  • Спам-боты: Спам-боты — это программы, которые автоматически ищут в Интернете формы, разделы комментариев и другие способы отправки своей информации. Эти боты могут быть запрограммированы так, чтобы оставлять нежелательный текст и ссылки в формах и комментариях, и они могут выполнять более вредоносные действия, такие как получение личной информации, распространение вредоносного ПО или захват контроля над веб-сайтом. Эту форму спама легче остановить, потому что ботам трудно обойти определенные меры по борьбе со спамом.

Почему важно остановить рассылку спама?

Для вашего веб-сайта и ваших посетителей полезно оградить себя от спама. Одна из причин заключается в том, что спам в формах может повлиять на ваш веб-сайт таким образом, что это навредит пользовательскому опыту. Если на вашем веб-сайте есть немодерируемая отправка комментариев и отзывов, они могут быть заполнены спам-сообщениями, содержащими рекламу, нежелательный текст и ссылки. Пользователей будет раздражать наличие спама, и они будут меньше взаимодействовать с вашим сайтом. Высокий объем спам-трафика и отправлений также может замедлить работу вашего веб-сайта и похоронить законные контактные формы, из-за чего вы будете медленнее отвечать реальным пользователям. Пользователи будут разочарованы, если вы слишком долго будете отвечать на их формы.

Еще одна причина, по которой важно остановить спам, заключается в том, что он может сильно исказить аналитические данные для измерения посещаемости веб-сайта и лидогенерации. Отправка спам-форм искусственно завышает количество потенциальных клиентов, генерируемых вашим веб-сайтом, и кто-то должен потратить время, чтобы просмотреть каждую отправку, чтобы найти законные формы. Завышенные цифры трафика также могут затруднить определение того, сколько законного интернет-трафика привлекает ваш сайт.

Следующей причиной, по которой вам необходимо остановить спам, является защита вашего веб-сайта и ваших посетителей от вредоносных программ. Ссылки, оставленные в комментариях и отправленных формах, могут вести на фишинговые веб-сайты или веб-сайты, которые устанавливают вредоносные программы или крадут личную информацию. Наличие этих ссылок на вашем сайте подвергает посетителей риску. Спамеры также могут использовать спам-формы, чтобы получить контроль над частью вашего веб-сайта и вставлять невидимые ссылки, которые дают им преимущество в SEO.

Советы по предотвращению отправки спама из форм

Спам из форм раздражает и потенциально опасен для вашего веб-сайта и посетителей. Следующие действия могут помочь вам предотвратить спам на вашем веб-сайте.

Предлагайте контактные формы вместо адреса электронной почты

Важно предоставить вашим посетителям способ связаться с вами, и безопаснее делать это с помощью отправки контактной формы, чем путем отображения вашего адреса электронной почты. Если ваш адрес электронной почты виден на вашем веб-сайте, спамеры и спам-боты найдут этот адрес и отправят спам прямо в ваш почтовый ящик. Использование контактных форм позволит вашим пользователям связываться с вами напрямую через отправку форм, и многие из них имеют встроенные меры безопасности, которые помогут блокировать отправку спама.

Установить Google reCAPTCHA

Одной из распространенных мер защиты от спама, которая использовалась в течение длительного времени, были CAPTCHA, которые были тестами, предназначенными для различения пользователей-людей и предотвращения отправки форм ботами. CAPTCHA были эффективны для блокировки ботов, но они стали раздражать пользователей, поскольку некоторые CAPTCHA было трудно понять, и пользователям требовалось от 10 до 30 дополнительных секунд, чтобы заполнить и отправить форму. Использование этих CAPTCHA привело к общему снижению количества отправленных форм. Спам-боты также со временем научились обходить CAPTCHA.

По этим причинам Google прекратил проверку CAPTCHA, но ввел меру защиты от спама, называемую reCAPTCHA. ReCAPTCHA — это кнопка, которая просто просит пользователей щелкнуть, чтобы подтвердить, что они не роботы. Это проще и требует меньше времени для пользователей и по-прежнему эффективно блокирует большинство спам-рассылок.

Используйте Honeypots

Honeypots — отличная альтернатива CAPTCHA для защиты от спама, которая никоим образом не причинит неудобств вашим пользователям. По сути, приманки — это фрагменты кода, которые отображают дополнительные формы, которые видны только спам-ботам. При появлении этой дополнительной формы спам-бот автоматически заполнит все поля и отправит форму. После отправки формы наличие дополнительной информации приведет к тому, что она будет помечена и автоматически отклонена, поэтому вам не придется тратить время на отправку спама.

Законных пользователей не будут беспокоить приманки, потому что они запрограммированы так, что видятся только ботам. Использование приманок создаст более удобный опыт для пользователей, потому что их не будет беспокоить скрытая форма, и вам не нужно будет использовать reCAPTCHA. Это может помочь увеличить количество законно отправленных форм.

Использование вопросов при отправке форм

Добавление поля формы, содержащего простой вопрос, — еще один эффективный способ защиты от спама. Убедитесь, что это такой вопрос, на который может легко ответить практически любой. Распространенным типом вопросов, используемых в формах, является простой математический вопрос, такой как 2+2=, с небольшим полем для ввода ответа. Если ваш веб-сайт привлекает международный трафик, убедитесь, что этот вопрос переведен на столько языков, сколько необходимо вашим посетителям.

Не разрешать ссылки

Как упоминалось в предыдущем разделе, одной из основных целей спамеров является размещение несанкционированных ссылок на веб-сайтах. Один из способов остановить это — запретить ссылки в формах, отзывах и комментариях. Это эффективно для остановки спам-ботов и ручных спамеров, которые пытаются добавить ссылки на ваш сайт.

Подтверждение адресов электронной почты

Спамеры и спам-боты часто используют поддельные или одноразовые адреса электронной почты при отправке контактных форм. Вы можете защититься от этого, добавив в процесс отправки дополнительный шаг для подтверждения адресов электронной почты пользователей. Вы можете сделать это, немедленно отправив электронное письмо на адрес электронной почты, указанный в форме, со ссылкой для завершения отправки. Пользователи должны войти в свою электронную почту и открыть сообщение, чтобы щелкнуть эту ссылку, чтобы заполнить форму. Большинство ботов не сделают этого дополнительного шага, как и спамеры-люди, если адрес электронной почты, который они используют, является поддельным.

Вы также можете установить плагины, которые могут обнаруживать поддельные адреса электронной почты, новые адреса электронной почты и адреса электронной почты, которые использовались для злонамеренных действий или манипулятивного поведения.

Использование анализа времени

Вы можете помочь отличить отправленные спамом формы от законных отправлений, внедрив анализ времени для отслеживания количества времени, необходимого для заполнения и отправки формы. В целом, заполнение формы должно занимать у людей больше времени, чем у спам-бота, который мгновенно заполняет все поля формы. Отслеживание времени должно начинаться, когда пользователь нажимает на форму, и заканчиваться, когда форма отправляется.

Единственная проблема заключается в том, что опция автозаполнения позволяет законным пользователям заполнять формы почти мгновенно, что может затруднить отличить это от отправки спам-ботом. Чтобы эффективно использовать этот метод защиты, вам необходимо провести небольшое исследование, чтобы определить среднее время, необходимое человеку для заполнения и отправки формы. Вы также можете добавить вопрос или reCAPTCHA, что заставит людей потратить пару дополнительных секунд на выполнение.

Ограничение и блокировка IP-адресов

Вы можете остановить спам, исходящий из одного источника, ограничив IP-адреса определенным количеством отправленных форм в течение заданного периода времени и заблокировав IP-адреса, которые превышают этот лимит. Вы также можете немедленно заблокировать IP-адреса, если их активность вызывает подозрения.

Защитите свой веб-сайт от спама с помощью форм, работая с профессионалами веб-дизайна Proceed Innovative

Остановка отправки спама с форм улучшит функциональность и удобство работы вашего веб-сайта, а также защитит вас и ваших пользователей от вредоносных программ и злонамеренных действий. Эти меры также позволят получить более точные данные о трафике веб-сайта, лидогенерации и отправке форм, которые помогут вам лучше управлять своей кампанией цифрового маркетинга.

Для реализации описанных выше методов защиты от спама необходимо внести изменения в серверную часть вашего веб-сайта. Эти методы требуют кодирования или установки плагина. Если вам неудобно вносить эти изменения на свой веб-сайт, вам следует обратиться к профессионалу в области веб-дизайна, например Proceed Innovative.

В Proceed Innovative мы предоставляем полные услуги цифрового маркетинга, которые включают веб-дизайн и обслуживание, а также поисковую оптимизацию (SEO) и внедрение аналитики веб-сайтов и консультации. Наши специалисты по веб-дизайну могут добавить коды и плагины на ваш веб-сайт для реализации этих мер защиты от спама, а наша команда SEO может проанализировать аналитику вашего веб-сайта, чтобы найти отклонения, которые могут указывать на спам-активность. Если вам нужен новый веб-сайт, мы можем спроектировать и создать веб-сайт, который включает в себя эти меры для защиты от спама со дня запуска вашего веб-сайта.

Позвоните нам по телефону (800) 933-2402 или отправьте контактную форму, чтобы узнать больше о наших услугах веб-дизайна.

Веб-спам: Полное руководство

Понимание границ и как перестраховаться

Вы веб-спамер? Нет, серьезно, я серьезно. Если есть одна область, в которой многие поисковые специалисты и маркетологи не всегда разбираются, это штрафы и фильтры от поисковых систем. Это то, что вы найдете очень распространенным в кругах SEO. Нам не нужно смотреть дальше чего-то вроде дублированного контента. Хотя это (как правило) фильтр, нет недостатка в людях, которые называют его «9». 0099 Штраф за дублирование контента ».

Таким образом, я подумал, что было бы неплохо взглянуть на множество лиц веб-спама с точки зрения поискового инженера. Этот не для того, чтобы научить вас быть лучшим спамером — на самом деле, как раз наоборот, поскольку я не фанат этого дерьма. Конечно, у меня есть несколько приятелей, которые играют в мир черных шляп, но они прекрасно знают, что я не фанат этого и не загрязняю сеть в целом.

Мы надеемся, что это путешествие поможет вам избежать тактики или групп действий, которые могут подвергнуть риску вашего клиента или ваши собственные веб-сайты.

Определение веб-спама

Что такое веб-спам? В исследовании для этого поста это казалось лучшим или, по крайней мере, наиболее кратким определением, с которым я столкнулся:

любое преднамеренное человеческое действие, которое призвано вызвать неоправданно благоприятную релевантность или важность для какой-либо веб-страницы, учитывая истинное значение страницы . (из таксономии веб-спама, Стэнфорд)

Хммм. Или это? Если бы это было так, мы ВСЕ были бы спамерами, поскольку то, что мы делаем как оптимизаторы, — это попытка немного сложить колоду. Черт. Ну что ж. Еще интереснее то, что в Стэнфордской статье далее говорится:

Важный голос в области веб-спама принадлежит оптимизаторам поисковых систем (SEO), таким как SEO Inc. (www.seoinc.com) или Bruce Clay (www.bruceclay.com).

Ой. Совсем нехорошо — как насчет:

Большинство оптимизаторов утверждают, что спам только повышает релевантность запросов, не связанных с темой (темами) страницы. В то же время многие SEO-специалисты одобряют и практикуют методы, которые влияют на показатели важности для достижения того, что они называют «этичным» позиционированием или оптимизацией веб-страницы. Обратите внимание, что согласно нашему определению, все виды действий, направленных на повышение рейтинга, без улучшения истинного значения страницы считаются спамом. (выделено мной)

Боже мой — это напоминает нам, что SEO-специалисты не преступники, но они, безусловно, враги. Давайте немного отвлечемся и посчитаем, что спам — это наглая манипуляция, не добавляющая ценности и пытающаяся использовать алгоритмическую слепоту алгоритма поиска, хорошо? Лол — оставь это. И никогда не забывайте, они не любят нас (оптимистов).

Типы веб-спама

Существует два основных типа спама: усиление и сокрытие.

Повышение

Это когда кто-то предпринимает действие, направленное на (ложное?) увеличение или повышение ценности страницы.

  • Спам терминов : Это могут быть те, кто пытается манипулировать такими элементами, как НАЗВАНИЕ страницы (заголовок спама), мета-описание или мета-ключевые слова (мета-спам). Как известно большинству из нас, два из трех из них были злоупотреблены до такой степени, что большинство современных поисковых систем вообще не используют их в качестве сигналов.
  • URL-спам — еще одна область, на которую они, как известно, тоже смотрят. Да, как бы странно это ни звучало, поскольку некоторые поисковые системы придают URL-адресам некоторый вес, это можно считать манипуляцией.
  • Спам ссылок Поисковые системы учитывают не только массу ссылочного спама, но и анкорный текст, так как это один из наиболее важных сигналов с точки зрения ранжирования. Этот раздел, очевидно, также включает случаи, когда спамеры пытаются сбросить ссылки на страницы, чтобы повысить ценность целевых страниц (форумы, комментарии, гостевые книги и т. д.), и, очевидно, более гнусные методы взлома и удаления.

Техники сокрытия

Этот набор техник используется, когда используются незаметные методы повышения ранжирования страницы. Или, что более уместно, сокрытие методов усиления. Это, безусловно, более проблематично, и поисковые системы склонны рассматривать их как более коварные, чем повышающие.

  • Сокрытие контента : Это методы, при которых термины и ссылки скрываются, когда браузер отображает страницу. Более распространены подходы с использованием цветовых схем, которые делают рассматриваемые элементы фактически невидимыми.
  • Маскировка : Мы все это знаем, верно? Это когда кто-то идентифицирует поисковый робот и пытается показать пауку другую версию страницы, чем это было бы для обычного пользователя. Предполагается, что это сокращает количество сообщений об изменениях, о которых сообщают пользователи или конкуренты, которые в противном случае могли бы увидеть спам-страницу.
  • Перенаправление : страница автоматически перенаправляется браузером таким же образом, так что страница индексируется движком, но пользователь никогда ее не увидит. По сути, действует как прокси / дверной проем для игры на движке и дезориентирует пользователей.

Подходы к борьбе со спамом в Интернете

Содержимый спам

Язык : В некоторых тестах поисковые инженеры изучали фактические языки страниц, чтобы увидеть, что они могут найти. Следует отметить, что французский язык чаще всего оказывался спам-фестивалем, а затем немецким и английским. Мне эта схема показалась интересной.

Домен : Я уверен, что неудивительно, что домены .BIZ имеют гораздо более высокий уровень спама, чем любые другие. Затем последовали домены .US и .COM. Но .BIZ были на голову выше остальных — держитесь от них подальше, хорошо?

Слов на странице : Другой часто используемый подход. Они обнаружили, что страницы с большим количеством текста часто содержали больше спама. Эта кривая уменьшилась после 1500 слов. Диапазон 750-1500 казался самым привлекательным для спамеров.

Ключевые слова на странице TITLE : Это еще одна область, на которую они будут обращать внимание, так как тестирование показало, что спам-страницы, как правило, используют гораздо больше KW в элементе TITLE, чем не спам-страницы.

Количество анкорного текста : Еще один интересный подход заключается в рассмотрении соотношения текста и анкорного текста на странице. Это может быть на уровне страницы или сайта. Веб-сайты с высоким процентом анкорного текста (по сравнению со стандартным текстом) с большей вероятностью будут спам-сайтами.

Часть видимого содержимого : относится к попыткам использования скрытого текста, не путать с соотношением кода и текста. Они смотрят на процент текста, который на самом деле не отображается на странице.

Сжимаемость : В качестве механизма, используемого для борьбы с набивкой KW, поисковые системы также могут учитывать степень сжатия. Или, точнее, повторяющееся или вращение контента. Поисковые системы часто сжимают страницу, чтобы избежать индексации и обработки. Существует коэффициент сжатия (несжатый, разделенный на сжатый), который, вероятно, будет иметь спам-страницы.

Всемирно популярные слова : Еще один хороший способ найти наполнение KW — сравнить слова на странице с существующими данными запроса и известными документами. По сути, если кто-то использует KW для заданных терминов, они будут использоваться более неестественно, чем пользовательские запросы и заведомо хорошие страницы.

Спам-запросы : С ростом популярности анализа запросов, данных о кликах и персонализации спамеры могут пытаться запрашивать различные целевые термины и нажимать на свои собственные результаты. Если посмотреть на шаблон запросов в сочетании с другими сигналами, эта тактика станет статистически очевидной.

Спам на уровне хоста просматривает другие сайты и домены на уровне сервера и/или регистратора. Как и в случае с рейтингом доверия, спамеры часто находятся в одном районе с другими спамерами.

На основе фраз : При таком подходе вероятностная модель обучения с использованием учебных документов ищет текстовые аномалии в виде связанных фраз. Это похоже на начинку KW на стероидах. Поиск статистических аномалий часто позволяет выявить спам-документы.

Спам по ссылкам

TrustRank : У этого метода несколько названий, TrustRank — разновидность Yahoo. Концепция вращается вокруг наличия «хороших соседей». Исследования показывают, что хорошие сайты ссылаются на хорошие и наоборот. Вас знают по компании, которую вы держите.

Наполнение ссылками : Это будет скорее подход на месте, когда спамер создаст массу малоценных страниц и укажет все ссылки (даже на сайте) на целевую страницу. Спам-сайты, как правило, имеют более высокое соотношение этих типов неестественного внешнего вида (к обучающему набору заведомо хороших страниц).

Непотистские ссылки : Здесь у нас будет все, от платных ссылок до обменных (взаимных). Хотя это может быть туманной областью для SEO-специалистов, поисковые системы, безусловно, считают манипулирование ссылками в любой взаимной форме открытой манипуляцией.

Топологический спам (ссылочные фермы) : Несмотря на то, что у нас есть собственный жаргон на этот счет, поисковые системы будут смотреть на процент ссылок в диаграмме по сравнению с известными «хорошими» сайтами. Как правило, те, кто хочет манипулировать поисковыми системами, будут иметь более высокий процент ссылок от этих местных жителей.

Временные аномалии : Еще одна область, в которой спам-сайты обычно выделяются среди других страниц корпуса, — это исторические данные. В индексе будет среднее значение приобретения и распада ссылок с «обычными» сайтами. Временные данные могут быть использованы для обнаружения спам-сайтов, использующих неестественные привычки построения ссылок.

Уроки для SEO-специалистов

Какой во всем этом смысл? Для меня эта тропа была интересна на нескольких уровнях. Давайте посмотрим:

  • Сигналы ранжирования : Если мы реконструируем их обратное проектирование нас, мы сможем начать фактически видеть, какие сигналы важны и какие они хотят защитить. Понимание того, что они защищают, говорит нам о том, что они считают важным. Верно?
  • Сигнальная воронка : Учитывая количество усилий, приложенных к ссылочному спаму, мы знаем, что современные поисковые системы, ориентированные на ссылки, заинтересованы в менее диверсифицированных подходах к ранжированию. То есть, если вам НУЖНЫ ссылки для ранжирования, они знают, где искать спамеров. Борьба с веб-спамом тесно связана с будущим поиска. Смотри и учись.
  • Вы плохие парни : Как уже говорилось, нас нет в списках рождественских открыток большинства поисковых инженеров. Знайте это и поймите это. Они терпят нас — даже самых благонамеренных «белых шляп» среди нас.
  • Демпфирование более распространено : Еще одна вещь, которую я узнал, это то, что чаще всего, особенно в случае с пограничным ссылочным спамом, отключается сок, а не деиндексируется сайт. Это штраф или фильтр? Это имеет значение?
  • Авторитет/Доверие : Было бы разумно следить за тем, где мы играем. Создание авторитета и установление связей с другими известными организациями в большом почете.

Как всегда, никогда не помешает лучше понять поисковые системы, если вы собираетесь оптимизировать для них. Черт возьми, может быть, если мы, как группа, начнем лучше понимать поисковых инженеров и их проблемы, когда-нибудь они смогут говорить о нас хорошо. Нет, это просто глупый сон.

Комбинации создают спам-сигналы

Всегда важно помнить, что в большинстве случаев ни один сигнал, ни подход не считаются окончательными. Поисковые системы часто используют различные методы для поиска спама. Это для тех из нас, кто ведет себя хорошо, означает, что вероятность ложного срабатывания меньше.

Для того, чтобы ваши клиенты или вы попали в горячую воду, как правило, означало бы, что вы будете удовлетворять более чем одному элементу . При этом большинство людей в поисковом сообществе не являются большими поклонниками SEO, и есть те, кто чувствует себя даже второстепенным» манипуляции » должны быть наказуемы. Насколько я знаю, нам пока не стоит слишком беспокоиться о линчевании. В конечном счете, есть уровни и пороги, и пока вы избегаете слишком большого количества проводов, все должно быть в порядке.

Одно можно сказать наверняка: вы станете гораздо лучшим специалистом по поисковой оптимизации, если лучше разберетесь в поиске информации. Этот пост затрагивает некоторые общие аспекты — для тех, кто заинтересован, есть ТОННА других.

Надеюсь, вам понравилось путешествие… играйте осторожно!

Патенты, статьи и видео

Прежде чем я уйду, вот масса исследований и литературы, которые вы можете изучить, если хотите узнать больше — моя цель всегда состоит в том, чтобы мотивировать людей учиться больше. Ни один пост в блоге не может оправдать какую-либо тему IR (информационного поиска). Ниже приведены некоторые элементы, на которые я обращал внимание, собирая это вместе.

Исследования веб-спама

  • Двойная воронка спама: соединение веб-спамеров с рекламодателями – система Search Ranger
  • Обнаружение нежелательных веб-страниц с помощью анализа контента — Microsoft
  • Улучшение классификации веб-спама с использованием функций ранжирования — (AIRWeb 2007)
  • Состязательный поиск информации в Интернете — (AIRWeb 2007)
  • Обнаружение веб-спама с использованием деревьев решений Индийский институт информационных технологий
  • Обнаружение веб-спама: методы на основе ссылок и контента — Yahoo
  • Идентификация веб-спама по содержимому и гиперссылкам — Yahoo

Концепции TrustRank

  • Борьба со спамом в Интернете с помощью TrustRank – Стэнфорд, 2004 г.
  • Распространение доверия и недоверия для снижения уровня веб-спама — Университет Лихай
  • Распознавание кумовских ссылок в Интернете — Б.Дэвисон
  • Обнаружение родственных ссылок по несогласию языковой модели
  • Альянсы по спаму ссылок – Стэнфорд
  • Знай своих соседей: обнаружение веб-спама с использованием веб-топологии — Yahoo
  • Выявление чрезмерно взаимных ссылок между веб-объектами — Yahoo (патент)

Ссылочный спам

  • Обучение на основе малых выборок для обнаружения веб-спама на основе ссылок – Китайская академия наук
  • Неправомерное влияние: устранение влияния плагиата ссылок на рейтинг в веб-поиске – B Wu, BD Â
  • Обнаружение спама по ссылкам с использованием временной информации — Microsoft
  • Извлечение ссылочного спама с помощью предвзятых случайных блужданий из начальных наборов спама — B Wu, K Chellapilla
  • Анализ ссылок для обнаружения веб-спама — Yahoo Research
  • Обнаружение ссылочного спама на основе массовой оценки — Стэнфорд
  • Характеристика на основе ссылок и обнаружение веб-спама — Yahoo

Неявные/явные сигналы

  • Идентификация веб-спама с помощью анализа поведения пользователей — AIRweb
  • Обнаружение веб-спама, ориентированного на поведение пользователя — WWW
  • Обнаружение веб-спама с помощью анализа коммерческих намерений — Андрас Бенчур, Иштван Биро, Карой Чалогани
  • Интеллектуальный анализ журнала запросов для обнаружения спама — Yahoo

Маскировка

  • Маскировка и перенаправление: – Предварительное исследование Университета Лихай.
  • Обнаружение семантической маскировки в Интернете — Университет Лихай

Социальный спам

  • Антисоциальный теггер — Обнаружение спама в системах социальных закладок — AirWeb
  • Эмпирическое исследование выборочной выборки при активном обучении для обнаружения сплагов — AIRweb
  • Выявление видеоспамеров в социальных сетях онлайн — Политехнический университет
  • Обнаружение спама в социальных сетях — Университет Индианы

Связано с языком/семантикой

  • Идентификация веб-спама с помощью анализа языковой модели — AIRweb
  • Обнаружение веб-страниц со спамом посредством анализа контента — Microsoft
  • Изучение лингвистических функций для обнаружения веб-спама: предварительное исследование — разные авторы

Видео

Веб-спам: д-р Марк Найорк, Microsoft Research блоги и интернет-сообщества.

Другие видео:

  • Использование распространения ранга и вероятностного подсчета для обнаружения спама на основе ссылок – Yahoo! Исследования
  • Web Spam Challenge 2007 Track II – Исследование корпорации Secure Computing
  • Обнаружение веб-спама – Римский университет Сапиенца
  • WITCH: новый подход к обнаружению веб-спама – Google Tech Talks

Патенты

Сигналы, связанные с доверием

  • Yahoo – Идентификация узлов спама с помощью многоуровневого графического обучения
  • Yahoo — обнаружение узлов спама на основе уровней прогнозирования распространения

Спам в запросах

  • Классификация страниц веб-спама с использованием данных, зависящих от запросов — Microsoft

Ссылочный спам

  • Обнаружение веб-спама по изменениям ссылок на веб-сайты — Microsoft
  • Метод обнаружения ссылочного спама в базах данных с гиперссылками – Google
  • Выявление чрезмерно взаимных ссылок между веб-объектами — Yahoo
  • Обнаружение спама на основе ссылок — Yahoo

Маскировка и перенаправление спама

  • Обнаружение маскировки с использованием популярности и рыночной стоимости.

    This entry was posted in Спам