Что такое заспамленность в антиплагиате: Что такое заспамленность текста и как этого избежать

Что такое заспамленность текста и как этого избежать

  • Копирайтинг
  • 14 декабря 2021

  • 7 мин.

  • Руководитель Rush Analytics

    Дмитрий Цытрош

  • Обновлено 15 сентября 2022

    Что изменено?

Всем привет! Мы продолжаем цикл статей о создании качественного контента и его оптимизации. В этой статье речь пойдет о спаме. Что такое спам, какие виды поискового спама бывают, что такое заспамленность и тошнота текста, как нужно оптимизировать тексты, чтобы избежать фильтров поисковых систем и занять место в ТОПе, какими SEO инструментами пользоваться? Обо всем этом мы поговорим в сегодняшней статье.

навигация по статье

  1. Что такое спам?
  2. Поисковый и контентный спам
  3. Как поисковые системы реагируют на спам в текстах?
  4. Как проверить попал ли ваш сайт под фильтр?
  5. Что такое заспамленность, водность, тошнота текста?
  6. Как предотвратить спам на странице?
  7. Анализ и оптимизация текста в Текстовом Анализаторе

Что такое спам?

Термин «спам» появился в интернете в начале 90-х и ассоциировался в основном с массовыми email-рассылками, которые распространяли ненужную людям информацию рекламного или другого характера. Но мало кто знает, что само слово “SPAM”расшифровывается как Spiced Ham (острая ветчина) и Shoulders of pork and ham (свиные лопатки и окорока). Впервые слово использовалось в 1936 году в качестве товарного знака для острых мясных консерв американской компании Hormel Foods. После Первой мировой войны, чтобы избавиться от остатков товара в избыточном количестве, компания запустила большую рекламную кампанию — на автомобилях и фасадах домов, на самолетах и ​​кораблях, на автобусах и трамваях, на витринах, в газетах и ​​по радио, везде, где только можно было, бросалось в глаза слово «SPAM». В дальнейшем, оно стало употребляться по отношению к любой ненужной и часто повторяющейся, бесполезной, навязчивой информации, а людей которые распространяли спам называли — спамерами.

Поисковый и контентный спам

  • Поисковый спам (спамдексинг) — разновидность веб-спама, применяется с целью обмануть поисковую систему и искусственно поднять веб-страницу в ТОП выдач, манипулировать результатами поиска. Проявляется через искусственное повышение частоты вхождений ключевого слова в тексте, в метатегах (title, h2, description), анкорах, атрибутах изображений. К поисковому спаму также относятся: свопинг, дорвеи, кликджекинг, клоакинг, дублированный, замаскированный контент и другие методы Black Hat SEO.
  • Контентный спам —  это малополезный, не релевантный и не уникальный, автоматически сгенерированный или перенасыщенный рекламой, не оптимизированный контент. Проявляется через высокую тошноту и заспамленность, а также «водность» текста, переспам по ключевым словам, не качественный рерайт.

Как поисковые системы реагируют на спам в текстах?

С появлением первых поисковых систем не было четко определенных алгоритмов семантического анализа, релевантность веб-страницы определялась в основном мета-тегами «keywords» и «description», что позволяло манипулировать SERP’ом (от Search Engines Result Page — результаты поисковой выдачи). Таким образом, количество не качественных сайтов, а также сайтов, которые использовали дублированный, украденный контент росло. В итоге, SERP захламлялся, а пользователь не получал точных результатов. Поисковики решили изменить эту ситуацию и ввели специальные фильтры, которые «зачищали» поисковую выдачу от спамных сайтов. Таким образом, в ТОП начали попадать только страницы, которые соответствуют поисковой оптимизации.

Какие же существуют фильтры поисковиков? Давайте остановимся на этом подробнее.

Текстовые фильтры Яндекса

  • Фильтр «Переспам» — появился, по словам некоторых оптимизаторов, еще в 2010 году и коснулся текстов сайтов. Оптимизаторы дали ему свое имя — «Ты спамный». Фильтр задевал длинные, не релевантные, «водяные» тексты-портянки, которые не имели четкой структуры, насыщенные большим количеством ключевых слов — писались не для людей, а поисковых ботов. Сайты, который попадали под фильтр резко теряли позиции (на 10-30 ступенек).
  • Фильтр «Новый» — является усовершенствованным алгоритмом «Переспама». Внимательный к сайтам с чрезмерно долгим и заспамленным Title, а также злоупотребление тегами выделения слова в тексте — <b>, <u>, <strong>, <em> и <i>, которые применяются некоторыми оптимизаторами для искусственного поднятия частоты ключевого слова на странице.
  • Фильтр «Баден-Баден» — является фактически сборной версией всех предыдущих антиспам-фильтров Яндекса. Был запущен 22 марта 2017. Его особенность — искусственный интеллект, который способен распознавать человеческую речь. Его задача — полностью и окончательно избавиться от спамных сайтов и сделать SERP более информативным и релевантным.

Текстовые фильтры Google

  • Фильтр «Панда» — по некоторым данным появился еще в 2011 году, а может и раньше. В отличие от «Пингвина», который наказывал за ссылочный спам, Панда проверяла их на дублированный и не оптимизированный контент. Сайты, которые копировали контент с других ресурсов, или публиковали бессмысленный, малоценный контент, насыщенный рекламой — подвергались жесткой фильтрации.
  • Фильтр «Колибри» — его название происходит от скорости и точности птички колибри. Запущен 26 сентября 2013. «Колибри» стал вестником глубокого семантического анализа с применением искусственного интеллекта, который постепенно внедрялся в Google. «Колибри» точно понимает логику поискового запроса пользователя, естественную человеческую речь, учитывая контекст и значение отдельных слов, с акцентом на разговорный стиль. Колибри еще называют — «понимающим алгоритмом». Таким образом, веб-разработчикам и авторам было рекомендовано оптимизировать свои сайты, используя естественное сочетание слов, например LSI ключи.

Как проверить попал ли ваш сайт под фильтр?

Проверить, были ли применены какие-то действия со стороны поисковых систем очень просто с помощью вебмастеров. В Яндекс Вебмастере перейдите в пункт Диагностика -> Безопасность и нарушения:

В Google Search Console — Проблемы безопасности и меры, принятые вручную -> Меры, принятые вручную:

Что такое заспамленность, водность, тошнота текста?

Заспамленность текста — это слишком частое повторение ключевого слова в тексте. Измеряется соотношением количества вхождений ключевого слова к общему числу слов в тексте. Заспамленность не должна превышать 60%. Тексты с высоким процентом заспамленности могут пессимизироваться поисковыми роботами (позиции понижаются за переспам), а при большом количестве заспамленных веб-страниц — сайт и вовсе могут забанить и он исчезнет из результатов поиска.

На уровень заспамленности веб-страницы также влияют такие показатели как: водность и тошнота текста.

  • Водность текста —  наличие в тексте стоп-слов, фразеологизмов, а также словесных оборотов, фраз, соединительных слов, не несущими смысловой нагрузки. От 15% до 30% — превышенное содержание воды в тексте, такой текст требует оптимизации.
  • Тошнота текста — примерно то же, что и заспамленность, являет собой насыщенность текста ключевыми словами, делится на классическую и академическую тошноту текста. По показателям тошноты можно судить о естественности, качестве текста. Высокий показатель тошноты означает, что текст писался для поисковых ботов, а не людей. Рекомендуется не поднимать классическую тошноту выше 3, академическая тошнота должна быть в пределах 3-10%.

Читайте также: Составляем список стоп-слов

Пример заспамленного текста (курсивом выделен переспам по ключевому слову):

«Мы продаем эксклюзивные коробки для сигар. Наши эксклюзивные коробки для сигар изготавливаются вручную. Если вы хотите приобрести эксклюзивную коробку для сигар, свяжитесь с нашим специалистом по продаже коробок для сигар по адресу eksklusivnie.korobki@example.com.»

Присоединяй­тесь к

Rush-Analytics уже сегодня

7-ми дневный бесплатный доступ к полному функционалу. Без привязки карты.

Попробовать бесплатно

Как предотвратить спам на странице?

Во-первых, нужно писать уникальные и качественные тексты своими словами, пользуясь при этом рекомендациями Яндекс и Google:

Малополезный контент, спам, избыток рекламы — Яндекс Помощь

Запросный спам — Яндекс Помощь

Блог Яндекса для вебмастеров / Тексты оптимизировались, переоптимизировались, но не выоптимизировались

Руководство по поисковой оптимизации — Справка Google

Ошибки в содержании статьи — Справка Google

Что такое автоматически созданный контент? — Справка Google

Что такое скопированное содержание? — Справка Goolgle

Во-вторых, придерживаться советов, которые были описаны в нашем мануале «Как написать статью для блога?».

И в-третьих, пользоваться SEO-инструментами для проверки и оптимизации текста, например:

  • Анализ текста по закону Ципфа
  • Анализ уникальности текста в Advego и Text.ru
  • Анализ орфографии и грамматики текста
  • Yoast SEO plugin for WordPress
  • Текстовый Анализатор Rush Analytics

Анализ и оптимизация текста в Текстовом Анализаторе

Инструмент удобен тем, что он может вывести любую страницу из-под текстового фильтра, а также может сравнить текстовую оптимизацию вашей веб-страницы и страниц-конкурентов из выдачи ТОПа, а потом на базе этого сравнения выдать готовое техническое задание на оптимизацию или написание текста с нуля.

К примеру, возьмем веб-страницу с переспамом и отправим ее на анализ в Текстовый Анализатор по продвигаемому ключевому слову «спортивная одежда adidas»:

На первом шаге создания проекта указываем поисковую систему (Yandex/Google) и точный регион, а также добавляем продвигаемые на странице ключевые слова:

На втором шаге добавляем URL страницы, которую нужно проанализировать и выбираем нужных конкурентов из ТОПа, желательно исключить сайты-агрегаторы и не прямых конкурентов:

Можно загрузить свой список URL конкурентов для сравнения и задать нужный тип фильтрации:

Жмем кнопку «Следующий шаг» и запускаем проект. На выходе получим файлы отчетов:

  • Текстовый анализ (XLSX) — это таблица для оптимизатора, содержит результаты текстового анализа;
  • ТЗ копирайтеру (DOCX) — все то же, что и в таблице, только в формате технического задания;
  • Ваш SEO-текст (TXT) — в этом файле показан основной текст на странице в который нужно вносить изменения.

Откроем таблицу Excel с анализом и ознакомимся с результатами, которые нам выдал инструмент:

Читайте также: Оптимизация под голосовой поиск

Как видим, система зафиксировала переспам «Баден-Баден» по ключевому слову «adidas» и сразу же порекомендовала удалить его из текста 17 раз. Далее, нам предложено в зоне h2 удалить “спортивная одежда adidas” и поставить фразу «Одежда Adidas», а в TITLE —  сделать комбинацию из 5 слов, обязательными среди которых должны стать «одежды adidas» или «одежду adidas», на выбор. Таким образом, Title может выглядеть так: «Магазин спортивной одежды adidas» или «Купить одежду adidas по низким ценам».

Подробнее о работе с Текстовым Анализатором читайте в специальной статье.

Вот и все, нам удалось очистить текст от переспама, тем самым избежав фильтра “Баден-Баден” и оптимизировать его под поисковые системы. В результате, веб-страница должна хорошо ранжироваться и занять место в ТОПе. Осталось только регулярно проверять позиции.


Просмотров

5850

Рейтинг

5,0/5

Оценить

Комментариев

1

Комментировать

Другие наши статьи

На страницу статей

  • Контент

Верстка и оформление статей на сайте

Вы можете написать интересный текст, придумать цепляющий заголовок, но если статью будет сложно читать, то вы рискуете потерять своих посетителей.

  • Valeriy London

  • 17 октября 2021

  • 6 мин.

  • Копирайтинг

Работаем с Текстовым Анализатором в Rush Analytics

Сегодня, когда контент играет все большую роль в продвижении сайтов, найти инструмент с помощью которого можно качественно оптимизировать текст под поисковые машины — цель каждого оптимизатора или seo-копирайтера.

  • Дмитрий Цытрош

  • 17 октября 2021

  • 10 мин.

Получите 7 дней бесплатного доступа

Здесь вы можете собрать поисковые подсказки из Яндекс, Google или YouTube

Зарегистрироваться

что это такое и как снизить

Вы читаете данную статью? И вы нашли ее в Яндексе или Гугле? Это значит что заспамленность нашей статьи в норме, а раз вы нашли ее через поисковик, то и позиции нашего материала высоки. Этого достаточно чтобы мы могли с уверенностью сказать, что разбираемся в том, что такое заспамленность текста, как ее снизить и как повысить ранжирование вашего материала в поисковике.

Кроме того, есть другая категория людей, которая непосредственно сталкивается с таким понятием, как заспамленность в антиплагиате, это студенты, которые сдают работы на проверку в вузе.

Вам мы также расскажем о том, влияет ли заспамленность на оригинальность текста и на сдачу работы в вуз.

Итак, поехали…

Содержание

 

1 Что значит заспамленность текста?

2 Что такое заспамленность текста в антиплагиате?

3 Заспамленность текста – важен ли это параметр для студента?

4 Какова норма заспамленности в тексте (в процентах)

5 Как снизить заспамленность текста

 

 

ЧТО ТАКОЕ ЗАСПАМЛЕННОСТЬ ТЕКСТА?

 

Чтобы понять, что такое заспамленность текста, давайте вначале разберемся, что такое спам в тексте, и как с ним можно переборщить, чтобы превратиться в заспамленность.

Как правило, при написание различного рода контента и статей для продвижения своего сайта или блога, люди используют ключевые слова в тексте. Без них, материал не будет высоко ранжироваться и не появиться в верхних строчках Яндекса или Гугла.

Для того, чтобы текст был быстро проиндексирован и поднялся высоко в поисковике, важно наличие достаточного количества повторяющихся ключевых слов.

Так вот заспамленность в тексте, это “передоз” с ключевыми словами, а именно, чрезмерное использование данных слов в написанном материале.

При размещении статьи на интернет ресурсе, поисковики, видя заспамленность и перебор с ключевыми словами, могут отправить статью “Минусинск”, а по-простому в БАН, и даже убрать написанный материал из поиска.

СОВЕТ.

Крайне не рекомендуем превращать ваш текст в сплошной набор ключевых слов. В первую очередь вы должны писать для людей, а не для роботов  Яндекса и Гугла.

Думайте в первую очередь о полезности написанного контента, о том, интересно ли его читать и поможет ли он людям получить ответы на все интересующие его вопросы по теме.

При этом используйте ключевые слова по мере необходимости. Подробнее о том, какое количество ключевых слов является нормой и как не получить заспамленности текста, мы расскажем далее.

Зная, что такое заспамленность текста в антиплагиате вы сможете избежать многих проблем при продвижении вашего сайта.

 

ЧТО ЗНАЧИТ ЗАСПАМЛЕННОСТЬ ТЕКСТА В АНТИПЛАГИАТЕ?

 

Важным моментом является понимание того, что значит заспамленность текста в антиплагиате и как применить это в работе.

Всем известно, что написанный текст требует проверки на оригинальность в системах Антиплагиата.

Более того, важно иметь высокий уровень уникальности текста, только это позволит продвинуть ваш материал и повысить позиции сайта.

Так вот, с помощью специальных сервисов, можно проверить не только уникальность текста, но и узнать уровень заспамленности.

Одним из лучших антиплагиатом для того, чтобы определить количество заспамленности, является сервис text.ru

Мы считаем данный сайт лучшим в определении данного показателя. С помощью текст.ру, можно определить уровень заспамленности, своевременно принять меры и снизить его до нормы.

 

ЗАСПАМЛЕННОСТЬ ТЕКСТА – ВАЖЕН ЛИ ЭТО ПАРАМЕТР ДЛЯ СТУДЕНТА?

 

Как правило, такой параметр, как заспамленность, важен тем, кто продвигает свой сайт или блог в интернете.

Но не стоит забывать и про другую категорию пользователей — студентов и аспирантов.

И многие из них не знают, важен ли такой параметр как заспамленность, при сдаче работы на проверку антиплагиата в вуз.

Отвечаем —  нет, абсолютно не важен. Просим вас не тратить время на определение данного показателя, он никак не учитывается при проверки курсовой или дипломной работы на оригинальность.

Более того, в вузах используют совершенно иную систему проверки текста на уникальность и это, как правило, сервис антиплагиат ру или антиплагиат вуз.

В них, такой показатель как заспамленность отсутствует вовсе.

Поэтому, если вы студент и переживаете по поводу уровня заспамленности вашего текста —  забудьте. Вас это не коснется.

Вам важнее повысить уникальность текста и добиться высокого показателя оригинальности.

Кстати, можете прочитать нашу статью, в которой мы рассказали о 30 реальных способах, которые помогают повысить уникальность текста.

 

КАКОВА НОРМА ЗАСПАМЛЕННОСТИ В ТЕКСТЕ (В ПРОЦЕНТАХ)

 

Очень многие, рассказывая о норме заспамленности в тексте, начинают говорить о каких то цифрах, подсчетах и прочей математике.

Мы же, хотим дать простой, дельный, проверенный и эффективный совет.

СОВЕТ

При написании текста не зацикливайтесь на заспамленности и количеству ключевых слов.

Если вы выбрали тему для написания, просто раскройте ее, дайте полезную информацию людям, и периодически, примерно 1-2 раза на 1 лист текста 14 шрифта, не забывайте вставить ключевое слово.

Это позволит вам сохранить уровень заспамленности в норме и при этом, угодить поисковикам.

Помните, в первую очередь, яндекс и гугл любят хороший, полезный и качественный контент. Не думайте, что огромное количество ключевых слов, даст вам нужный результат.

Поисковики сегодня очень умны, и пару заголовков, включающих ключевики + 7-8 ключевых слов(примерно на 5000 символов) им вполне достаточно, чтобы понять, о чем ваша статья.

Перебор не к чему.  

Но если вы, все таки,  хотите точных цифр, то скажем их вам. Для правильно написанного и SEO оптимизированного текста, норма заспамленности в процентах является уровень в 30-50 %, не более.

КАК СНИЗИТЬ ЗАСПАМЛЕННОСТЬ ТЕКСТА

 

Чтобы снизить заспамленность текста, прочитайте вашу работу. Обратите внимание на те предложения, где ключевые слова идут в ряд, и на лицо их излишнее количество.

Удалите лишнее, оставьте 1-2 главных ключевых слова на 1000-1500 символов. Этого достаточно.

Важно, чтобы текст после написания был хорошо читаем и не было излишка повторяющих ключевых фраз.

Снизить заспамленность важно, ведь перебор с ключевиками может негативно отразиться на индексации статьи.

И еще раз хотим повторить важную фразу – пишите материал для людей, не для поисковых роботов, постарайтесь написать материал так, чтобы после прочтения, пользователь не полез вновь в Яндекс, для поиска ответов на вопрос, который вы не сумели до конца раскрыть.

Именно это, поможет вам быстро поднять вашу статью в ТОП.

Также вы можете бесплатно воспользоваться программой для рерайта. Это новая разработка, которая помогает все авторам — копирайтерам и рерайтерам быстро создавать новые статьи и отдавать заказы с минимальной водностью. Вы просто находите контент под вашу тему и обрабатываете его через программу. Вот и все.

Посмотрите, как это делается в нашем видео.

 

Полезные материалы:

Что такое вода в тексте – ее норма?

Обзор нового умного синонимайзера

7 лучших Антиплагиат онлайн сервисов

Законно ли обходить Антиплагиат. УК РФ

Обзор сайта ЕТХТ Антиплагиат 

Что такое Хештег? Как правильно его использовать?

Что такое подкаст — самыми простыми словами

Рерайт — что это и как его сделать самому бесплатно

Рост спама, связанного с плагиатом

Джонатан Бэйли16 декабря 2015 г.

Как и почти каждый блог или веб-сайт, который находится в сети дольше нескольких недель, Plagiarism Today регулярно становится мишенью спамеров. Однако на протяжении большей части истории сайта этот спам не имел отношения к основной цели сайта.

Несмотря на то, что я встречал спам от нелегальных аптек до порнографии, я практически никогда не встречал автоматизированного спама для службы обнаружения плагиата (вероятно, поддельной). Конечно, несколько сервисов по борьбе с плагиатом опубликовали нежелательные коммерческие комментарии, это были единичные случаи.

Однако 23 ноября я подвергся автоматической спам-атаке из-за сомнительной программы проверки на плагиат. Большинство комментариев были автоматически заблокированы перед публикацией, но семь были пропущены до того, как автор был заблокирован на сайте.

С тех пор я подвергся еще нескольким атакам, большинство из которых было остановлено либо автоматически, либо вручную после всего лишь одного или двух сообщений. Каждая атака указывала на разные домены, но подходы к атакам были очень похожими.

Твиттер, однако, не намного лучше. Поиск ссылок на плагиат на сайте показывает, что от одной трети до одной четверти всех ссылок являются спамом, в основном указывающим на один домен. Ссылки, как показано слева, часто могут быть быстрыми.

Спам-плагиат, к сожалению, стал новой горячей тенденцией для спамеров, и те, кто интересуется плагиатом, скорее всего, пострадают от него.

Но главный вопрос не в том, «Почему спамеры выбирают ключевое слово для плагиата?» Вопрос: «Почему сейчас?»

Объяснение подъема

Моей первой мыслью, когда началась первоначальная спам-атака, было то, что ее время истекло, чтобы совпасть с выпускными экзаменами для студентов колледжей. Это имело смысл с той атакой, поскольку она использовала службу «обнаружения плагиата», которая на самом деле была просто рекламой службы написания эссе.

Тем не менее, другие спам-атаки были сосредоточены на услугах поисковой оптимизации (SEO), используя обещание проверки на плагиат для продажи рекламных мест для счетчиков статей или других неэтичных услуг SEO.

В то время как время имеет некоторое значение для студентов, время для целей SEO имеет меньшее значение. Хотя Google находится на тропе войны с сайтами с некачественным и неоригинальным контентом, его последние усилия начались в 2012 году с так называемых обновлений «Панда», которые начали понижать такой контент в своих результатах.

Декабрь 2015 года вряд ли кажется подходящим временем для продвижения инструментов борьбы с плагиатом среди чёрных оптимизаторов.

Многое из этого остается для меня загадкой. Хотя это, скорее всего, актуальная тема для горстки спамеров, время все равно очень странное.

Важный момент

Хотя время проведения спам-атаки пока может оставаться загадкой, ясно одно: доверять этим службам не стоит.

Как мы видели на примере Viper, неэтичные сервисы по обнаружению плагиата опасны, часто используя отправляемый вами контент способами, с которыми вы явно не соглашались или не одобряли.

В случае Viper они брали присланные эссе и предлагали их для скачивания или использования на веб-сайтах фабрики эссе. С этими спам-сайтами никто не знает, что произойдет после того, как вы нажмете «Отправить», поскольку у них нет условий обслуживания.

Но даже если сервис ничего не сделает с вашим контентом, это все равно будет некачественная проверка на плагиат. Например, я прогнал первые 700 слов Декларации независимости США через один из сервисов, и он вернул только 13 из 39 слов.отрывки были проверены как плагиат, что дало ему уникальный рейтинг 67%, хотя он был на 100% скопирован из одного из самых распространенных документов в Интернете.

Хуже всего то, что эти сайты используются для продажи неэтичных услуг и обогащения спамеров. По сути, они поддерживают одних из худших людей в Сети.

Так что, пожалуйста, если вы столкнетесь с плагиатом на этом сайте или где-то еще, не дайте себя обмануть. Существует множество авторитетных сервисов, которыми вы можете воспользоваться по низкой цене или бесплатно.

Bottom Line

В конце концов, не важно, почему небольшая группа плодовитых спамеров ухватилась за плагиат в качестве цели, важно то, что это не вознаграждается.

Хотя спамеры вряд ли нацелены на тех, кто искренне интересуется плагиатом, за исключением, может быть, тех, кто думает об этом в отношении SEO, важно, чтобы мы были в курсе того, что происходит.

Эти сервисы в лучшем случае представляют собой некачественные чекеры, поддерживающие неэтичные методы. В худшем случае они представляют собой активную опасность для любого контента, который через них проходит.

Так что имейте в виду, спамеры-плагиаторы продвигают сомнительные услуги. Хотя я уверен, что большинство будет инстинктивно избегать их, это для тех, кто этого не сделает.

Что такое спам в 2013 году?

Что такое спам?

Спам на заре Интернета был довольно простой концепцией. Этот термин был в значительной степени синонимом нежелательной коммерческой электронной почты (UCE). Вот почему знаменитый закон CAN-SPAM 2003 года касается исключительно электронной почты и ничего больше.

Но этому акту почти десять лет, и с тех пор Интернет сильно изменился. Это означает, что пришло время вернуться к вопросу и спросить себя: «Что такое спам в 2013 году?»

В наши дни нет простого ответа на этот вопрос, нет простого синонима, который мы можем подобрать. Даже наши параллели с реальным миром развалились. Спам похож на нежелательную почту? Или это как бекасные вздохи? Или вообще что-то другое?

Это не простой вопрос, но очень важный. То, как мы определяем спам, важно, потому что оно определяет, как мы относимся к нему и что мы делаем, чтобы его остановить.

Итак, стоит уделить время анализу термина «спам» и его значения, поскольку мы приближаемся к 10-летнему юбилею акта, носящего его имя.

Краткая история спама

Dictionary.com определяет спам как «деструктивные сообщения, особенно коммерческие сообщения, размещенные в компьютерной сети или отправленные по электронной почте».

Это четкое рабочее определение, и оно соответствует корням термина, который взят из скетча Монти Пайтона об одноименном мясе для завтрака (видео). В этой сцене владелец закусочной пытается отправить спам гостю, которому он не нужен, в то время как викинги постоянно скандируют «Спам» во время разговора.

Это укоренило идею о том, что «Спам» — это то, что навязывается вам вопреки вашему желанию и прерывает естественный разговор, что делает его легким аналогом роста спама в Интернете.

Но первым спамом была не электронная почта, он был в Usenet, люди размещали ненужные сообщения в группах Usenet, часто загромождая их для людей, которые хотели прочитать содержимое. Однако по мере того, как электронная почта становилась все более популярной и распространенной, чем Usenet, в ней также рос спам, и началась игра в кошки-мышки спамеров и блокировщиков спама, пытающихся превзойти друг друга.

Но эта тенденция сохранилась и в Интернете. По мере появления новых технологий, способствующих общению между людьми, спамеры стремились злоупотреблять ими. Это включает в себя веб-спам, спам в мессенджерах, спам в текстовых сообщениях, спам на форумах, спам в комментариях, спам в социальных сетях, спам в социальных новостях, и этот список можно продолжить.

В этом отношении спам стал более разнообразным, чем в 2003 году. Хотя постоянно создаются новые его формы, старые не исчезают. Все еще существуют спамеры Usenet, и, хотя технология фильтрации улучшилась, чтобы не допустить попадания большей части спама в наш почтовый ящик, более 70% всей электронной почты является нежелательной.

В результате каждый метод электронной связи, который мы изобрели, содержит спам или его эквивалент.

Хотя это делает борьбу со спамом важной, это затрудняет практическое определение этого термина.

Тем не менее, мы должны отказаться от широкого определения, если мы собираемся действительно определить, что делает спам спамом в новом году.

Проблема с определением

Каким бы работоспособным ни было приведенное выше определение, на самом деле оно имеет только одну определяющую характеристику того, что является или не является спамом, а именно «разрушающий характер». Однако ни одно из других определений на самом деле не лучше. Google определяет спам как «отправку одного и того же сообщения без разбора (большому количеству получателей) в Интернете», а определение Merriam-Webster даже не оставляет места для спама, кроме электронной почты.

Но даже сфокусироваться на разрушительном сложно, потому что то, что является или не является разрушительным, относительно. Если я публикую вакансию, которая у меня есть, на карьерном сайте, это именно тот контент, который нужен сайту. Если я отправлю то же сообщение на форум покемонов, это будет разрушительно.

Однако различия не всегда столь значительны. Посмотрите на большое сообщество, такое как Reddit, в котором есть много подсообществ или субреддитов. Люди постоянно хотят публиковать свой контент в самых популярных сабреддитах, в идеале в одном из сабреддитов по умолчанию, чтобы получить больше просмотров и больше внимания. Тем не менее, споры о том, где на самом деле принадлежит тот или иной контент, бесконечны.

Например, какая смешная картинка относится к r/funny или r/pics? Рассказ о крупном технологическом прорыве должен принадлежать /r/technology или /r/worldnews? Это лишь некоторые из вопросов, касающихся сабреддитов по умолчанию, даже не глядя на подсообщества, которые возникли вокруг некоторых из более крупных сообществ за эти годы. (Примечание: очевидно, что у сообществ есть свой набор правил для ответов на вопросы, но даже в этом случае они часто совпадают.)

Итак, если человек по ошибке публикует что-то, что, по мнению сообщества, должно быть размещено на другом форуме, это, безусловно, разрушительно, но я думаю, что большинство людей не хотели бы называть это спамом, особенно если бы это было в первый раз. Точно так же злонамеренный комментатор или «тролль» могут быть разрушительными, но мы редко называем такое поведение спамом.

Таким образом, не все деструктивные сообщения являются спамом, и, как следует из определения Dictionary.com, не весь спам является коммерческим. Если бы я разослал свой политический манифест миллионам незнакомых людей, это было бы спамом, как если бы это была реклама иностранных лекарств.

Но самая большая проблема в том, что не весь спам бывает даже в формате сообщения (по крайней мере, не в смысле сообщения от одного человека другому). Рассмотрим веб-спам или спам в блогах, который публикуется как веб-сайты. Цель состоит не в том, чтобы разрушить какую-либо платформу сообщений, а в том, чтобы разрушить сам Google.

Таким образом, не все деструктивные сообщения являются спамом, не весь фактический спам является коммерческим и, наконец, не весь спам включает сообщения.

Это оставляет нам хорошее, но весьма несовершенное определение спама и заставляет нас глубже взглянуть на проблему.

Стремление к лучшему определению

Имея это в виду, мы должны сделать шаг назад и посмотреть, что общего у всего, что мы считаем спамом. К сожалению, этот список довольно короткий.

  1. Нежелательный: Спам, независимо от того, где он размещен, нежелателен для всех, кроме спамера.
  2. Злонамеренное намерение: Отправитель/отправитель должен признать, что содержимое нежелательно, и отправить его, несмотря ни на что. По крайней мере, должна быть грубая небрежность.
  3. Цифровая связь На основе: Хотя телемаркетинг и нежелательная почта во многом похожи на интернет-спам, их обычно не называют спамом.

Сначала я включил в этот список несколько терминов, но удалил их, когда понял, что не весь спам подходит под это описание:

  1. Рекламный: Хотя это лучше, чем говорить «коммерческий», не всякий спам способствует чему-либо. Некоторые спам-тесты фильтруют без каких-либо рекламных материалов, а другие пытаются саботировать сайты, а не продвигать их.
  2. Массовая рассылка: Хотя большая часть спама рассылается массово, даже одна вопиющая публикация или отправка могут считаться спамом, особенно в сообществах, которые быстро пресекают такие публикации. Кроме того, Google регулярно деиндексирует страницы из-за поведения на сайте, независимо от дублирования.

Это оставляет нам слишком широкое и бесполезное определение: Спам — это любой нежелательный контент, размещенный или отправленный с помощью цифровых средств кем-то со злым умыслом или грубой небрежностью.

Но и это не подходит. При таком определении нет ничего, что отличало бы спам от другого нежелательного поведения в Интернете, таких как антисоциальные комментарии или действия, включая «троллинг».

Однако, если вы хотите включить каждое, казалось бы, приемлемое использование слова «спам», вы столкнетесь с проблемой. Мы так часто использовали это слово, что оно стало почти бессмысленным, используется для обозначения почти любого нежелательного контента, и это создает серьезную проблему с точки зрения правоприменения.

Если бы вы собирались разработать условия предоставления услуг, политику или даже закон о борьбе со спамом, вы бы подошли к веб-спаму так же, как к спаму в электронной почте? Спам в комментариях — это то же самое, что и спам в мессенджерах? Проблемы бесконечны.

Рассказывать о спаме в широком смысле стало почти бессмысленно, потому что сам термин. Это открывает некоторые очень серьезные проблемы реального мира, когда речь идет о проблеме, и нет простых ответов.

Bottom Line

Проблема с определением «спама» заключается в том, как оно эволюционировало. Каждый раз, когда появляется новая технология и кто-то злоупотребляет ею в личных целях, мы называем такое поведение спамом, даже если технически, юридически и даже этически это совершенно другое поведение. Термин «спам» теперь больше применяется к чувству, чем к действию.

В этом отношении спам сродни знаменитой шутке судьи Поттера Стюарта о порнографии: «Я узнаю это, когда увижу». По сути, вместо того, чтобы пытаться дать определение порнографии, судья Стюарт обратился в этом вопросе к своему внутреннему чутью. Хотя, вероятно, он точен, он почти бесполезен с практической точки зрения.

Спам стал проблемой «я узнаю, когда увижу». Однако это определение создает проблемы с борьбой с ним, поскольку могут быть реальные различия во мнениях относительно того, что такое спам. Лучшее, что вы можете сделать прямо сейчас, — это определить, что вы считаете спамом на своих сайтах, и придерживаться этих определений.

Для более широкой дискуссии, мы должны быть бдительными, говоря о различных типах спама. Поскольку общий термин почти бессмыслен, нам нужно взглянуть на использование «спама по электронной почте», «веб-спама», «спама в Твиттере» и так далее. Эти термины имеют гораздо более ясное значение, чем просто «спам».

В конце концов, то, как мы определяем спам, играет большую роль в том, как мы с ним боремся. Прямо сейчас, на самом широком уровне, мы сражаемся с призраком, изменяющим форму противником, не имеющим реальной сущности. Только когда мы разбиваем его на части, мы начинаем находить что-то более осязаемое и действенное.

This entry was posted in Популярное