Что такое поисковый спам

Что такое поисковый спам

Цель спама – обман поисковой системы для того, чтобы продвинуть ресурс в ТОП в результатах выдачи. Спамом считаются дублированный контент, дорвеи, свопинг. На просторах Рунета большая часть интернет-ресурсов – это спам.

Из истории

Термин «спам» расшифровывается как SPiced hAM, или острая ветчина, если перевести с английского языка. Согласно одной теории, после Второй мировой войны на складах компании Hormel Foods осталось много консервов с острой ветчиной, которую потребляла американская армия.

Чтобы как-то сбыть слегка подпорченный товар, компания принялась раскручивать продукцию, заклеив все витрины магазинов, здания, автомобили объявлениями со словом «SPAM», ветчина рекламировалась через радио и печатные издания. Но популярность «SPAM» обрел только в «Летающем цирке Монти Пайтона» в 1969г., где участники шоу спародировали такую агрессивную рекламу.

Этот инцидент привязали к случаю, произошедшему в 1986 г. в сети Usenet, где Дэйв Родес активно рекламировал финансовую пирамиду и обещал, что пользователи смогут на ней заработать много денег. Он рассылал огромное количество сообщений, что в итоге разозлило пользователей, а эти тексты стали именовать спамом.

В России спам появился с Августовским путчем 19 августа 1991 г., когда директор компании «Релком» рассылал пользователям обращение Бориса Ельцина.

О спаме снова вспомнили, когда в 1993 г. администратор сети Usenet Ричард Депью случайно отправил пару сотен сообщений на одну из конференций.

В следующем году компания Canter&Siegel завербовала программиста, чтобы тот разработал программу, распространяющую в Usenet рекламу услуг компании. После этого инцидента пользователи довольно быстро охладели к Сети.

Сегодня термин «спам» применим не только к почтовым и электронным рассылкам, но и в Интернете, где его называют спамдексинг.

Типология спама

Манипулировать поисковой выдачей можно по-разному при помощи:

  1. покупки ссылок;
  2. методов черного SEO, например, дорвеи или клоакинг;
  3. заспамленности ключевыми словами на странице или увеличения их веса;
  4. ключевых слова, не имеющие ничего общего с контентом, в тегах keywords и description. Из-за частых манипуляций в тегах поисковые системы снизили их важность, переключившись непосредственно на контент;
  5. текстового материала, сливающегося с фоном сайта, пользователь такой контент не видит, а робот замечает и индексирует.

Жизнь после спама

Из-за захвата спамом среды Интернет появилось огромное количество некачественных и бесполезных ресурсов, что затрудняет адекватное ранжирование сайтов. Сеть постепенно превращается в мусоросборник, переполненный коммерческими ресурсами.

15 июля 2015 года. Опубликовано в разделах: Азбука терминов. 6903

Поисковый спам – обман пользователя

Что такое поисковый спам и как его распознать? С точки зрения обычного человека, спам – это навязчивая реклама, возникающая вместо информации, которую юзер пытается отыскать. По своей сути, поисковый спам или вебспам – это попытка манипулировать результатами формируемой выдачи, с целью продвижения в ТОП 10 низкокачественных сайтов. Их содержание зачастую неинформативно или не отвечает запросам юзера.

Больше видео на нашем канале — изучайте интернет-маркетинг с SEMANTICA

Какие бывают виды поискового спама

Существует определенная классификация поисковых систем относительно спама. Как Яндекс, так и Google призывают вебмастеров и оптимизаторов воздержаться от нижеперечисленных методов продвижения.

1. Избыточное количество ключевых фраз в тексте. Это попытка максимально «накачать» текст ключами с целью завышения его позиции в поиске. Как определить спам данного типа? Сделать это можно по некоторым признакам:

  • наличие автоматически сгенерированного текста;
  • многократное повторение определенных словосочетаний;
  • выделение ключей тегами , ;
  • наличие скрытого текста, сливающегося с фоном страницы.

2. Дорвеи. Этим термином называют промежуточные web-страницы, выполняющие переадресацию посетителя на другой сайт. Чаще всего дорвей представляет собой сайт-одностраничник, оптимизированный под список ключевых фраз. Дорвеи создаются с помощью инструментов типа DMI, SEoDOR.

3. Ссылочный спам. С целью накрутки «веса» вебмастер может пытаться использовать ссылочный спам, к которому относится:

  • массовое приобретение гиперссылок с автоматических бирж;
  • спамерские ссылки, получаемые с блогов, форумов, гостевых книг;
  • создание сети небольших сайтов-сателлитов.

Поисковой спам и его последствия

Поисковики совершенствуют свои алгоритмы таким образом, чтобы по возможности исключить спамерские интернет ресурсы из выдачи. Методы пессимизации, применяемые к недобросовестным вебмастерам, зависят от типа нарушения. К примеру, чрезмерная концентрация ключевых слов в тексте приводит к понижению в результатах выдачи отдельно взятого документа. При этом остальной сайт продолжает нормально функционировать.

Дорвеи, обнаруженные поисковой системой, будут забанены. Судьба сайтов-сателлитов, разработанных с целью продвижения основного интернет ресурса, зависит от их качества. Если вебмастер создавал сателлит с применением уникальных и более-менее качественных текстов, то такой сайт может остаться в поиске.

Избыточная закупка ссылок грозит пессимизацией продвигаемому web-ресурсу. В целях борьбы с попытками манипулирования поисковой выдачей, Яндекс запустил в мае 2015-го года алгоритм «Минусинск».

Читайте также:  Ultra surround или dolby digital

О том, что собой представляет поисковый спам, методах и технологиях поискового спама, а также его классификации мы подробно расскажем в сегодняшней статье.

С каждым днем все большее количество людей полагается на поиск информации в Интернете. Это — в свою очередь — делает влияние Сети очень высоким, что может принести хорошую прибыль тем организациям, которые знают, как извлечь из этого пользу.

Наибольшую аудиторию удается найти через поисковые машины, поэтому очень часто робота-паука пытаются ввести в заблуждение, надеясь добиться высоких результатов поиска в погоне за новыми пользователями.

Как и в случаях с электронными ящиками, эти действия (заслуженно) можно назвать спамом Интернета. При огромном количестве результатов поиска их качество становится крайне низким. Поэтому краулерам очень важно надежно отсеивать спам и повышать таким образом качество поиска.

С потоком информации низкого качества многие поисковые системы до сих пор пытаются справляться вручную, но при этом потребность во множестве эффективных инструментов по борьбе со спамом все еще крайне актуальна. Чтобы правильно разработать актуальные методы борьбы со подобной информацией в Интернете, нужно понимать, как это работает.

Для этого создана полная общая схема по очистке от поискового спама на основе систематизированных подходов и специальных технологий.

Что представляет собой понятие поискового спама

За счет поискового спама некоторые страницы сайтов обманывают краулеров, тем самым занимая более высокие позиции по совершенно необъективным причинам. К сожалению, в последнее время количество «сетевого мусора» в поисковиках сильно возросло. Это привело к тому, что результаты поиска стали ухудшаться. Чтобы эффективно бороться с этим явлением, предлагаем различные методики.

Главное задание поисковых роботов – отфильтровать результаты запроса и отобрать только самые качественные за счет верного анализа интернет-страниц в соответствии с требованиями пользователя и при этом выдать только самые релевантные страницы. Поисковики обычно анализируют страницы в зависимости от ее соответствия запросу и важности, таким образом вычисляя общий порядок страничек, которые будут показаны пользователю. Важность страницы зависит от ее общей популярности (без учета спроса) и основана на ссылочной структуре (к примеру, страницы с большим количеством ссылок будут более важными), а также параметрах.

Само понятие поискового спама применятся в качестве термина для любых действий человека, которые направлены на создание необоснованно высокой релевантности или важности интернет-страниц (в сравнении с другими действительно значимыми веб-ресурсами). Еще одно название – спамдексинг. Людей, применяющих такие технологии, называют термином «спамер». Но в Интернете существуют и другие определения «сетевого мусора».

Поисковые оптимизаторы (такие, как seoinc.com и Брюс Клэй) играют важную роль в общей картине интернет-спама. Большая часть специалистов уверена, что нежелательные рассылки направлены на увеличение релевантности поисковых запросов, которые совершенно не относятся к основной теме интернет-страницы. В то же время некоторые оптимизаторы применяют так называемые «этичные» методы повышения позиций и оптимизации веб-страниц.

При этом рост позиций без улучшения контента страницы в соответствии с ее тематикой — это чистый спам.

  1. Повышение релевантности или значимости страниц за счет рекламных методов.
  2. Завуалированные способы увеличения ранжирования, которые напрямую не влияют на алгоритмы поисковиков, но применяются для сокрытия усвоенных рекламных методов от обычных пользователей.

Методы, направленные на увеличение роста популярности страницы

Спам в выражениях

Это методы спама, оказывающие прямое воздействие на алгоритмы ранжирования.

Во время оценки текстовой релевантности поисковые роботы учитывают расположение на странице запросов. Каждое такое место называется «поле». Типичным текстовым полем для странички Р будет само тело документа, тайтл страницы, мета-теги заголовка HTML, а также веб-адрес. Также существует такое понятие, как анкер текстового поля – это текстовый указатель, который связан с URL, что указывает на данную страницу и принадлежит этой странице. Они нередко неплохо описывают контент страницы. Выражения в текстовом поле веб-ресурса зачастую применяются для установления релевантности странички в соотношении к какому-либо запросу (набору особых слов). Различные поля получают разный вес. Заспамленные выражения относятся к методу, при котором производится анализ содержимого полей таким образом, чтобы странички с «сетевым мусором» стали более релевантными для тех или иных запросов.

Спам выражений – методы

Их можно сгруппировать в соответствии с текстовыми полями, содержащими спам.

  • Спам в самом теле веб-документа

Заспамленные выражения содержатся в теле документа. Это самый простой и распространенный метод спама.

Apartment Rent Orenburg Orenburg Hotel Orenburg Hotel Orenburg Russia Orenburg Flight Orenburg Russia Flower To Orenburg Orenburg Travel Orenburg Apartment Orenburg .
Results for Apartment Rent Orenburg

Читайте также:  Фильм по игре диабло

Современные поисковики зачастую высоко оценивают выражения, которые используются в названии веб-документа. Поэтому в заголовке часто содержатся выражения со спамом.

Натяжные потолки, натяжные потолки Москва, натяжные потолки цены, натяжные потолки монтаж, натяжные потолки технология, натяжные потолки фото, натяжные потолки отзывы

Из-за частого использования спама в мета-тегах HTML поисковики стали придавать меньше значения этим тегам или вообще их игнорировать.

Поисковые машины придают высокое значение указателям выражений в тексте, потому что они должны содержать краткое описание контента. Именно поэтому спам нередко можно заметить в анкере HTML c гиперссылкой на страничку. Отличие этого вида нежелательных рассылок от других состоит в том, что заспамленные выражения добавляются на страницы, которые ссылаются на главную. С учетом индексации текста в анкерах для двух страниц спам оказывает влияние на ранжирование обеих страниц сразу.

Некоторые поисковые машины для определения релевантности разделяют адрес страницы на несколько выражений. Этим часто пользуются и спамеры, которые создают длинные веб-адреса, содержание определенную последовательность выражений со спамом.

Нередко сочетаются несколько методов создания «сетевого мусора». Например, в ссылочном спаме нередко можно заметить анкер текста или адрес одновременно.

Еще один способ классифицирования способов спама основывается на совокупности определенных выражений в текстовом поле.

  • Накачка выражениями со спамом дублирующего содержания. Целые куски текста дублируются, а в них в случайном порядке вводятся спамосодержащие выражения. Но такой метод работает только в том случае, если тема текста является редкой и в Интернете релевантных страниц на эту тему содержится очень мало. Накачку могут применять и для разбавления, чтобы обмануть поисковые алгоритмы в случае, если требуется спрятать повторяющиеся выражения со спамом.
  • Повтор некоторых выражений с целью повышения релевантности документа в отношении меньшего количества запросов.
  • Демпинг огромного объема совершенно разных выражений с целью придания странице высокой релевантности за счет большого количества разнообразных запросов. Демпинг эффективен только в том случае, если они неточные или редко встречаются. Совершенно очевидно, что в соответствии с такими поисковыми запросами релевантными окажется лишь пара-тройка страниц, поэтому веб-ресурс даже с огромным количеством спама и невысокой релевантностью выйдет в ТОП-10 результатов выдачи.
  • Склейка определенных выражений или фраз применяется спамерами для скорого производства контента. При таком методе разные предложения или фразы из различных источников соединяются вместе. Наполненная таким спамом страничка в итоге может быть выдана при любом запросе темы исходного предложения.

Также поисковые машины используют ссылочную информацию для определения важности интернет-страницы. Поэтому спамеры нередко делают особую ссылочную структуру для увеличения веса одной или более страничек.

Спам в ссылках

Алгоритмы ссылочного спама

У спамеров все веб-страницы делятся на три типа:

  1. Недоступная веб-страница, которую спамеру не под силу изменить.
  2. Доступная веб-страница, которая принадлежит другим людям, но спамер в той или иной мере способен ее изменить: путем добавления записи в комментарии или гостевую книгу, в которой будет ссылка на страницу со спамом. Но зачастую фильтр доступных страниц является косвенным.
  3. Собственная страница, которую создал и поддерживает сам спамер. Такую страницу еще называют «фермой спама». Главная задача спамера – увеличить вес одной или нескольких веб-страниц. Например, есть некая страница Т. На ее содержание необходимы определенные расходы, поэтому у спамера ограниченное количество таких страниц.

Два популярных алгоритма по оценке важности результатов запросов на основе ссылочной информации.

Алгоритм «HITS» используется для ранжирования страниц с определенной тематикой. Но часто применяется общий алгоритм для всех страниц, для определения «ядра» и влияния результатов на каждую страницу. В соответствии с циркулярным определением «HITS», основные авторитетные страницы — это те, что указывают на несколько других авторитетных страниц, а весомые авторитетные страницы – это те, на которые указывают основные.

Поэтому при использовании алгоритма «HITS» ранжирование в результате поисковой выдачи появляется в виде списка страниц с наибольшим весом и авторитетностью.

При этом весомые страницы просто заспамить при помощи добавления исходящей ссылки в другие всемирно известные страницы с хорошей репутацией. Поэтому спамер будет добавлять множество исходящих ссылок на страницу Т для увеличения веса.

А вот повышение авторитетности – это сложный процесс, так как требует большого количества входящих ссылок с весом страниц. Но спамер может увеличить вес своей страницы за счет входящих ссылок, а затем дать ссылку на главную страницу с этих страниц. Наличие ссылок с доступных весомых страниц увеличит авторитетность главной страницы спамера. Поэтому он будет размещать ссылку на главную страницу на всех доступных ему страницах. Также любые иные собственные страницы должны иметь ссылки на другие авторитетные веб-ресурсы.

Читайте также:  Для чего нужен винт

Алгоритм «PageRank» для придания общего веса всем страницам Интернета применяет входящую ссылочную информацию. В соответствии с «PageRank» большое количество входящих ссылок на страницу предполагает ее большую популярность среди обычных людей (пользователи будут делиться ссылками на весомые страницы). То есть на весомую страницу будут ссылаться другие весомые страницы. То есть данный алгоритм основан на взаимоукреплении страниц: вес страниц оказывает воздействие на эту страницу, а эта страница оказывает влияние на вес других страниц.

Анализируя алгоритм, удалось установить, что общий показатель авторитетности страницы состоит из r total-группы страниц или страницы и основан на четырех факторах:

R total = r total + r in – r out – r sink,

r static – это вес, приобретенный из статического распределения;
r in – это вес через входящие ссылки с внешних страниц;
r out – это вес, утекающий из-за исходящих ссылок на внешние страницы;
r sink – это вес, который был потерян из-за низких страниц в группе.

Данная формула дает понять, какой должна быть оптимальная ссылочная структура, максимально увеличивающая весомость главной страницы.

Благодаря такой схеме все собственные странички остаются доступны из досягаемых страниц, что позволяет поисковой системе индексировать их и включает в себя минимум ссылок.

Для улучшения авторитетности страницы спама и страницы Т есть особые приемы.

  1. В «ферме спама» используются только собственные страницы, что дает сильный прирост постоянного веса r static.
  2. Из доступных страниц «фермы спама» накапливается большое количество входящих ссылок, что увеличивает общий вес r in.
  3. Ссылающиеся не на «фермы спама» ссылки сдерживаются, приближая r out к нулю.
  4. За счет избегания «пониженных» страниц в «спам-ферме» каждая страница (в том числе и Т) будет содержать ряд исходящих ссылок, за счет чего r sink приблизится к нулю.

Также вес страницы Т создается за счет ссылочной структуры в «ферме спама» на следующей основе:

  • за счет ссылок на главную страницу всех доступных и собственных страниц ее исходящий вес можно максимально увеличить;
  • если делать ссылки со страницы Т на прочие собственные страницы, то удастся избежать потери значительной части веса. Подобный замкнутый цикл дает возможность весу, утекающему с Т, вернуться обратно. При это не стоит создавать такие циклы межу Т и доступными страницами, иначе это снизит общий вес «фермы спама».

Технологии ссылочного спама

За счет ручного добавления исходящих ссылок на авторитетные страницы может быть увеличен основной вес. Но самый эффективный метод – каталог ссылок. В Сети подобных сайтов-каталогов насчитывается немало. Такие ресурсы сортируют содержимое по тематическим разделам и подразделам и подбирают релевантные сайты для каждой темы по запросу. За счет частичного и полного дублирования страничек каталога спамерам удается быстро создать масштабную структуру исходящих ссылок.

Для накопления весомого количества входящих на главную или группу страниц применятся следующие методы.

  • Создается группа страниц с полезной информацией и скрытыми ссылками на главные страницы со спамом. Затем пользователей призывают ссылаться на ресурсы, что повышает ранжирование главной страницы. Сюда же можно отнести и копирование каталогов.
  • Фильтруется каталог ссылок. Ряд сайтов дает возможность разместить ссылки на свои сайты в конкретном разделе каталога. Иногда такие ссылки не проверятся, и спамер может добавить в каталог ссылки на свою главную страницу. За счет высокого рейтинга авторитетности и большого веса каталогов ссылок данный метод эффективно повышает авторитетность главных страниц.
  • Ссылки размещаются на досках объявлений и гостевых книгах, которые не модерируются. Опытные спамеры способны в обычные сообщения добавлять ссылки на нужные страницы. Из-за отсутствия контроля со временем страницы таких досок объявлений приравнивают к спаму.
  • Обмен ссылками. Целые группы спамеров могут договариваться друг с другом и организовывать общие структуры по обмену ссылками.
  • Создание собственной «фермы спама». За счет контроля большого количества сайтов и создания произвольной ссылочной структуры удается повысить ранжирование главных страниц. Если ранее такой метод был дорогим, то сейчас стоимость регистрации домена или веб-хостинга значительно снизилась.

Сокрытие указателей – обычное поведение спамеров. Чаще всего пытаются скрыть повторные выражения или долгий список ссылок. Спамеры применяют особые методы, которые помогают скрывать от пользователей и поисковых машин свои страницы с огромным количеством спама.

Скрытые методы спама

Скрывание содержимого

Можно добиться невидимости для обычных людей некоторых фраз или ссылок на просматриваемой странице. Очень часто применятся окрашивание текста в документе HTML в цвет фона страницы.

Ссылка на основную публикацию
Что значит спящий режим компьютера
В операционной системе Windows есть несколько режимов выключения компьютера – это обыкновенный режим, (который полностью выключает PC), режим гибернации и...
Чем открыть файл с расширением dat
После установки каких-нибудь программ, получения почты при помощи почтовых клиентов, на компьютере создаются .dat файлы. Чаще всего они почти не...
Чем отличается frontend от backend
Переводы , 13 апреля 2017 в 19:58 Мая Устинова Вы наверняка уже слышали эти модные в сфере программирования слова «фронтенд»...
Что значит сторнировать документ
Сто́рно (итал. storno — перевод на другой счёт, отвод; от stornare — поворачивать обратно) — в общем смысле возврат к...
Adblock detector