КИНЗА 2016 - конференция по заработку на сайтах и трафике

Зависимость дополнительных результатов поиска по сайту в Яндексе и места в ТОП 10

Привет, друзья! Вот и пришло время результатов моего долгожданного анализа поисковой выдачи Яндекса. Почему долгожданного? Потому что, во-первых, обещал его опубликовать достаточно давно. Во-вторых,  было проделано много работы. Спешу поделиться полученными результатами.

анализ результатов по ссылке "еще" в серпе Яндекса

Заголовок немного получился заумным, но именно так и назывался анализ, которым я заинтересовался несколько недель назад. Его целью было определение зависимости между позицией в ТОП 10 и количеством дополнительных результатов поиска по сайту. Все мы прекрасно знаем, что в поисковой выдаче Яндекса есть такая кнопочка «Еще».

поисковая выдача Яндекса

Она показывает результаты поиска по данному запросу только в пределах выбранного ресурса. В приведенном выше примере страница по ссылке будет выглядеть так.

выдача по ссылке "еще"

Видно, что с моего блога по данному ключевому слову еще есть 435 ответов на запрос пользователя. Так вот, мне стало интересно, есть ли зависимость между данным числом на место в ТОП 10?

Логика и суть анализа

В чем здесь логика? В том, что по идее было бы эффективнее выше показывать в поисковой выдаче проекты, которые смогут дать пользователю больше ответов на его запросы. Конечно, это не может быть ключевым фактором в ранжировании. Зато для понимания принципов работы поисковой системы Яндекс, выявления закономерностей поведения алгоритмов, считаю, что знать будет не лишним :smile:.

Начало анализа

Чтобы провести данный анализ, в первую очередь, нужны были ключевые слова. Для более точных результатов я решил подготовить их вручную. Мною было выделено 4 группы по 500 запросов в каждой (в итоге получилось 2000):

  1. Геозависимые высокочастотники;
  2. Геозависимые низкочастотники;
  3. ГеоНезависимые высокочастотники;
  4. ГеоНезависимые низкочастотники.

Почему именно так? Хотелось проанализировать поведение поисковой выдачи в 4 разных средах:

  1. Коммерческие с высокой конкуренцией;
  2. Коммерческие с низкой конкуренцией;
  3. Некоммерческие с высокой конкуренцией;
  4. Некоммерческие с низкой конкуренцией.

То есть было принято допущение: высокочастотный=высококонкурентный, низкочастотный=низкоконкурентный. В качестве анализируемого региона был выбран «Москва». Среднечастотные запросы не брал, чтобы оставить большой коридор между анализируемыми группами.

На список запросов и ушла львиная доля времени :smile:. Для выявления количества результатов поиска по сайту для выбранных ключевиков, исходя из места в ТОП 10, я заказал парсер на бирже фриланса. Если делать все это вручную, то заняло бы не меньше нескольких недель. В результате получалась такая картинка (видно только ТОП 4).

результаты по ссылке еще

То есть сначала идет запрос, а дальше количество результатов по ссылке «еще» для 1-го места в десятке, для 2-го, для 3-го и так далее. Ключевые слова выбирались не из одной тематики. Охвачено было примерно 90-100 сфер: от хостинга до вязания. На одну сферу бралось не более 10 ключевиков. Если в запросе было имя собственное, указание региона, а также явное указание на какой-то ресурс (например, «вконтакте» или «одноклассники»), то он не брался в расчет.

После получения всех данных по 4-м группам запросов встал вопрос — «Как анализировать полученные данные?». Сначала я хотел просто сложить сумму количества результатов для первого места в выдаче, потом для второго и так далее. В этом случае, были бы большие погрешности. Сравните, например, «продвижение сайтов» и «интернет магазин автозапчастей». Для первого не больше 2000 результатов, а для второго — не менее 31000. То есть второй тянул бы одеяло на себя :smile:.

Потом была идея взять 1-е место за единицу, а остальные сравнивать именно с первой позицией. Данный вариант также не давал объективную оценку. Третьим же и, как я считаю, наиболее удачным вариантом оказалось отношение количества результатов поиска по ссылке «еще» к среднеарифметическому из ТОП 10 по анализируемому запросу. Другими словами, сначала высчитывалось среднее арифметическое по строке, а потом оно становилось знаменателем для каждого значения из столбца. В результате было получено следующее.

результаты отношения

Далее было высчитано среднее арифметическое для каждого столбца и уже получены графики зависимости.

По оси X место в ТОП 10. По оси Y — среднеарифметическое от отношений количества результатов поиска по ссылке “еще” в Яндексе к среднеарифметическому из ТОП 10 по анализируемому запросу.

Результаты анализа

Для коммерческой высококонкурентной среды

анализ "еще" для ВЧ ГЗ

Для коммерческой низкоконкурентной среды

анализ "еще" для НЧ ГЗ

Для некоммерческой высококонкурентной среды

анализ "еще" для ВЧ ГНЗ

Для некоммерческой низкоконкурентной среды

анализ "еще" НЧ ГНЗ

Сводный график

сводный график по анализу

Выводы

В среднем по массиву анализируемых запросов наблюдается снижение количества результатов поиска в пределах сайта по ключевому слову. Особенно это заметно на сводном графике. Что это может означать? То, что сайты, которые дают больше ответов на запросы пользователя в среднем оказываются выше в поисковой выдаче.

Это также может объяснять факт того, что довольно трудно продвинуть нетематическое ключевое слов. Например, «уход за хомячками» на ресурсе про рыбалку. Также это может объяснять, широкое присутствие тематических сайтов в десятке Яндекса.

Погрешности

Я выбирал запросы для анализа только по тем параметрам, которые были указаны в начале поста. Все остальные факторы имели значение случайности. Но все равно на 4-х графиках отмечается одинаковая тенденция.

Возможно, если какой-то другой человек сделает свою выборку по запросам, то могут получиться другие графики. Для кого-то моя выборка в 2000 запросов может показаться нерепрезентативной. Да, например, список в 1 миллион анализируемых ключевых слов мог бы показать более объективные результаты. Но затраты ресурсов (в первую очередь, временных), на мой взгляд, не оправдали бы важность полученных выводов.

По ходу подготовки к этому анализу в голову пришла еще одна интересная идея для исследования. Также нужно проанализировать на эту же тему и google. Но все это будет в новом году, а пока я жду от вас комментарии и отзывы ;-). Если появились какие-то вопросы, то задавайте их ниже.

1 звезда2 звезды3 звезды4 звезды5 звезд (3 голос., в среднем: 5,00 из 5)
Loading ... Loading ...

Socialhammer - продвижение в ВК и Инстаграмме

Дата: 25.12.2012
Получайте актуальные статьи по SEO, блоггингу и заработку в Интернете
прямо на ваш почтовый ящик. Уже более 3000 подписчиков!

Отзывов уже 53:

  1. 1. Алексей | 25 Декабрь 2012

    Конечно интересно, но как-то не очень ясно что нужно делать в следствие этих выводов. То есть нужно по определенному ключевому слову написать больше разных статей?.. А как тогда правильно распределить тайтлы и дескрипшены, то есть ключи в них..

  2. 2. Sosnovskij | sosnovskij.ru | 25 Декабрь 2012

    Алексей, не нужно под один и тот же запрос создавать отдельные страницы. Главное, чтобы по запросу сайт выдавал как можно больше ответов. Это не означает, что все документы на проекте должны быть заточены под один ключевик.

  3. 3. Александр | 25 Декабрь 2012

    Пробовал так делать.
    Не работает.
    Это как бы рекомендация хорошая. но в топ сайт она не выведет

  4. 4. Алексей Владимирович | plus.google.com/u/0/110297642853881987151 | 25 Декабрь 2012

    Количество страниц в поиске – это абсолютно не показатель. Для этого даже эксперимент не стоило проводить.

    Проверить можно было просто проанализировав выдачу. Сам продвигаю сервис онлайн-консультирования для сайта. В том числе по запросу [консультант]. Стало интересно проверить эту зависимость у сайтов в ТОП-20. Так вот, по этому запросу (регион СПб) у трёх сайтов, находящимся в 20-ке количество страниц от 26 до 98 (мой в их числе), а у остальных от нескольких тысяч, до нескольких миллионов.

    Собственно говоря, эксперимент на этом можно закончить :evil:

  5. 5. Sosnovskij | sosnovskij.ru | 25 Декабрь 2012

    Алексей Владимирович, вы вообще читали пост? Идет речь не о количестве проиндексированных страниц — это, во-первых. Во-вторых, 1 запрос — совсем не показатель.

  6. 6. Sosnovskij | sosnovskij.ru | 25 Декабрь 2012

    Алексей Владимирович, и еще, это не эксперимент, а анализ :).

  7. 7. Sosnovskij | sosnovskij.ru | 25 Декабрь 2012

    Александр, конечно, не выведет. Если эта зависимость и влияет на ранжирование, то является далеко не определяющим фактором.

  8. 8. Алексей Владимирович | plus.google.com/u/0/110297642853881987151 | 25 Декабрь 2012

    Sosnovskij, Вообще читал, поэтому и комментарий оставил. Возможно, 1 запрос не показатель, так проверить можно по любому количеству. Знай себе — бери запрос и анализируй выдачу. Для этого анализа не стоило нанимать фрилансеров, имхо.

    В каком месте я написал о «количестве проиндексированных страниц»? Если вас смутила фраза «Количество страниц в поиске «, то употребляя её я и имел ввиду кол-во страниц по данному запросу.

  9. 9. Dovganich.com | Dovganich.com | 25 Декабрь 2012

    Не зря качественные нишевые проекты ранжируются на порядок лучше, чем сайты более широких тематик.

    Стоит отметить, что и в данном случаи возможен переспам. А также не стоит забывать о качестве контента.

    Алексей, на практике, если вы продвигаете запрос «жидкая теплоизоляция», то на вашем ресурсе должны быть страницы такие как «жидкая теплоизоляция крыши», «жидкая теплаизоляция трубопроводов» и т.д.

    По сути это продвижение низкочастотки, которая своим весом помогает поднять основные запросы. Поэтому рассматривать отдельно количество документов не правильно — все взаимосвязанно.

  10. 10. Sosnovskij | sosnovskij.ru | 25 Декабрь 2012

    Алексей Владимирович, я вас уверяю, что самому проверить 2000 запросов у вас не получится. Фрилансеров я не нанимал, а обратился к 1-му человеку для разработки парсера, который существенно сэкономил время.

  11. 11. bCrazy | bcrazy.ru | 25 Декабрь 2012

    Интересное исследование, но, на мой взгляд, не совсем корректное. Я бы рассматривал не количество ответов на запрос, а долю страниц сайта, отвечающих на запрос (другими словами, тематичность). На твоём блоге проиндексировано около 1000 странц, из них 435 отвечают на вышеуказанный запрос, т.е. около половины страниц. Если сравнивать с сайтом, на котором проиндексировано 10000 страниц, но на запрос отвечают так же 435, то логично предположить, что он будет ниже в выдаче. И вот это было бы интересно проверить на той же самой выборке.

  12. 12. Vitool | 26 Декабрь 2012

    Отличная статья. Обязательно поэксперементирую. Раньше не задумывался.

  13. 13. Sosnovskij | sosnovskij.ru | 26 Декабрь 2012

    bCrazy, вот это как раз я и собираюсь проверить в следующий раз ;-) .

  14. 14. pilika | 26 Декабрь 2012

    >>Видно, что с моего блога по данному ключевому слову еще есть 435 ответов на запрос пользователя.

    Очень часто бывает, что ключевое слово может находиться в шаблоне (футер, меню) и тогда по кнопке будут показаны все проиндексированные страницы сайта. А они не обязательно являются доп. ответами на запрос пользователя.

    На мой взгляд, для более точного эксперимента, нужно было использовать запрос site:domen.ru title:(ключевое слово), где domen.ru это сайты из топ10 по выбранному запросу. Таким запросом вы с большей вероятностью найдете реальные доп. ответы по запросу, ведь если запрос есть в тайтле страницы, значит страница должна быть ему релевантна.

  15. 15. Sosnovskij | sosnovskij.ru | 26 Декабрь 2012

    pilika, поэтому и брались не 10 запросов, а 500 :smile: .

  16. 16. Руслан | 26 Декабрь 2012

    Рекомендация очень хорошая, но она не дает такого весомого результата

  17. 17. Я | 26 Декабрь 2012

    Это и так ясно, не стоило делать эксперимент. Пост не твоего уровня.

  18. 18. Sosnovskij | sosnovskij.ru | 26 Декабрь 2012

    Александр, это почему же и так ясно? С чего бы? На интуитивном уровне :)? Есть похожие анализы в рунете? Может, я просто пропустил.

  19. 19. Алексей | jarlex.com | 27 Декабрь 2012

    Сергей, молодец! Довольно интересно. Лично для меня этот пост кое-что объясняет. В принципе, я уже давно заметил, что ВЧ ВК и в Яндексе и в Гугле хорошо двигаются, если на сайте много материала по теме. (конечно, качественного материала)

  20. 20. Sorus_Nomad | 27 Декабрь 2012

    Как по мне, то этим можно «страдать» уже только когда все по проекту (сайту/блогу) сделано.

  21. 21. Sosnovskij | sosnovskij.ru | 27 Декабрь 2012

    Sorus_Nomad, по этому в принципе не нужно страдать :smile: . Это можно просто иметь в виду.

  22. 22. Геннадий Ольховский | mlm.genri.biz | 29 Декабрь 2012

    Прекрасный пост. Если сначала заниматься оформлением блога, а потом только написанием качественного контента, я думаю это не правильно. Нужно продвигать блог во всех направлениях.

  23. 23. sander | multiresell.ru | 30 Декабрь 2012

    «Для кого-то моя выборка в 2000 запросов может показаться нерепрезентативной.»

    Да хоть 5 или 10 миллионов запросов! Рожденному ползать…
    всю работу вы сделали для себяи она вполне устраивает. Другому все разжуй и в рот положи, а ни капли толку. Для себя лично я некоторые моменты взял на заметку, а к некоторым придется вернуться вновь…

  24. 24. Любовь | 1 Январь 2013

    Мне, чтобы понять придется раз 20 прочитать, ну что ж у вас на блоге полезные посты…

  25. 25. Grantablog | grantablog.ru | 3 Январь 2013

    Интересное иследование!Впринципе логика есть!

  26. 26. Читатель | 3 Январь 2013

    хороший анализ, я бы даже сказала эксперимент

  27. 27. Андрей | 3 Январь 2013

    Хорошая работа
    TF-IDF в действии :)

  28. 28. Renewed | 3 Январь 2013

    Хорошее исследование. Хотя выводы изначально были предсказуемы, теперь есть отличное доказательство.
    Из своего опыта давно уже заметил, что с публикацией страниц с заданными ключевыми словами, начинает подниматься в выдаче основная продвигаемая страница. Если добавить к этому ещё внутреннюю перелинковку, то некоторые СЧ запросы можно вывести в ТОП-10 без покупки ссылок.

  29. 29. Вадим | recteptydliadetei.ru | 5 Январь 2013

    Серьезный материал. Потверждение той истины, что материала по одной теме должно быть несколько.

  30. 30. site1992 | 7 Январь 2013

    Конечно интересно, но как-то не очень ясно что нужно делать в следствие этих выводов. То есть нужно по определенному ключевому слову написать больше разных статей?.. А как тогда правильно распределить тайтлы и дескрипшены, то есть ключи в них..

  31. 31. вася | 11 Январь 2013

    полный бред, любая проверка сразу даст кучу сайтов где ЕЩЕ в тысячи страниц ниже чем ЕЩЕ в 10 страниц прокачанная ссылками.

  32. 32. natkalin | allcastle.info | 13 Январь 2013

    Сергей, поражаешь проницательностью. Помнится, года полтора назад, заметив как ПС любят тематичные сайты, я задала этот вопрос здесь, чтоб подтвердить свои догадки. Ты ответил: нет, тематика не влияет… Спорить не стала, но если б ты тогда добавил несколько страниц с «BestMasterиZация» в титл (например, новость какую-то), уверена, было бы первое место.

    bCrazy, а в чем разница — 435 тематичных страниц с миллионника или с тысячника? Это влияет на информативность? Сайт хорошо раскрывает тему, а сколько страниц помимо этого вряд ли существенно. Процентным соотношением мерять нельзя, тема от этого не становится менее информативной.

  33. 33. Дмитрий | 14 Январь 2013

    Спасибо Сергей, за статью. Интересный материал

  34. 34. Sosnovskij | sosnovskij.ru | 14 Январь 2013

    site1992, этот пост скорее для понимания, чем для каких-то определенных действий.
    natkalin, не напомните комментарий? :)

  35. 35. Sosnovskij | sosnovskij.ru | 14 Январь 2013

    вася, вы называете бредом пост, но я ничего не понял из вашего комментария :).

  36. 36. Максим | 17 Январь 2013

    Алексей Владимирович,
    это просто ужас. КАК можно продвигать сайт по слову «консультант»? Это же не транзакционный запрос, это АД! Все равно, что продвигать интернет-магазин по слову «купить».

  37. 37. Валли | 22 Январь 2013

    Блин, катал катал коммент, а при добавлении меня спросили бот ли я без возможности ответить. Короче http://vm.msun.ru/Autor/Gusakov/Gloss/Hg.htm и Excel в помощь. В принципе среднеарифметическое сюда приплести возможно и стоит, не знаю, попробуй и другие способы.

    в «Некоммерческие низкой конкуренцией.» предлог «с» пропущен

  38. 38. Sosnovskij | sosnovskij.ru | 27 Январь 2013

    Валли, спасибо, поправил. Метод посмотрю.

  39. 39. Truman | 18 Февраль 2013

    Sosnovskij, поддержу bCrazy:

    не количество ответов на запрос, а долю страниц сайта, отвечающих на запрос (другими словами, тематичность).

    Интересно было бы ещё уточнить и влияние веса самих страниц — то есть мало того, насколько часто эти запросы на каждой странице встречаются, учесть бы ещё, сколько раз встречается на каждой из страниц и сам запрос, и однокоренные слова к словам из запроса.

  40. 40. Sosnovskij | sosnovskij.ru | 18 Февраль 2013

    Truman, это уже совсем другая сфера, не входящая в рамки данного анализа :smile: .

  41. 41. Truman | 19 Февраль 2013

    Sosnovskij, я это прекрасно понимаю — сложность, навскидку, на порядок выше.

    Спасибо за то, что есть! Скорее всего, в большинстве случаев, общее большое количество релевантных статей напрямую связано с высокой релевантностью каждой из статей, так как это указывает на сферу интересов участников дискуссий. Но отклонения от тенденции (пики на вторых-третьих местах) можно было бы (теоретически ;-) ) как раз списать на невысокую релевантность статей.

  42. 42. Николай | 10 Март 2013

    Большое спасибо за информацию. Раньше я как-то не задумывался проводить анализ таким образом, но попробую по некоторым поисковым запросам. Возьму вашу работу за пример)

  43. 43. sancheus | joomla-nsk.ru | 10 Март 2013

    Спасибо за статью

  44. 44. София | iPadTest.ru | 6 Апрель 2013

    Обзор интересный. Работа проведена качественно — спасибо автору. Но вот только выводы, ИМХО, не совсем верны!

    Если рассмотреть первую приведенную таблицу по строкам, можно обнаружить интересный факт — закономерности-то нет.

    Только по одному запросу «ещё» сайтов строго ранжировано. По двум — максимум у 1-го сайта, по двум — у четвертого, по двум — у третьего, по пяти — у второго.

    При этом разница между «ещё» соседних в выдаче сайтов может различаться более чем на порядок.

    При таких условиях усреднять противопоказан! Иначе получаем пресловутую «среднюю температуру по больнице»!

  45. 45. Sosnovskij | sosnovskij.ru | 8 Апрель 2013

    София, массив данных не складывался из 10 запросов. Вы предлагаете просто сложить общее количество дополнительных ответов с сайтов для 1 места, для 2 места и так далее без усреднения?

  46. 46. София | iPadTest.ru | 8 Апрель 2013

    Sosnovskij, ни в коем случае, хотя это принципиально ничего не изменит (на графиках уменьшится масштаб по оси ординат).

    Насчет нецелесообразности усреднения, это я вовсе не к тому, что Вы некорректно провели расчеты! Просто в приведенных данных больше видны различия, нежели какая-либо общая тенденция. (Понимаю, что это не все результаты — но что показали, на то и смотрю :twisted: )

    Да и по графикам можно заметить большие отклонения от «линии тренда», связанные, скорее всего, с присущей объему «ещё» вариативностью. А потому, опять-таки на мой взгляд, это самое «еще» – не влияющий фактор, а «побочный продукт» какого-либо другого фактора ;-)

  47. 47. Sosnovskij | sosnovskij.ru | 9 Апрель 2013

    София,
    «хотя это принципиально ничего не изменит (на графиках уменьшится масштаб по оси ординат).»
    Попробуйте поработать с таким объемом данных и вы увидите принципиальную разницу без усреднения. Цитата из поста «Сравните, например, “продвижение сайтов” и “интернет магазин автозапчастей”. Для первого не больше 2000 результатов, а для второго – не менее 31000. То есть второй тянул бы одеяло на себя.»

    «Просто в приведенных данных больше видны различия, нежели какая-либо общая тенденция.»
    Скриншот куска таблицы — это пример. Необходимы смотреть на графики.

    «с присущей объему «ещё» вариативностью»
    О какой вариативности идет речь? :)

  48. 48. София | iPadTest.ru | 9 Апрель 2013

    Sosnovskij! И я о том же :|
    И по строкам таблицы, и по столбцам разброс значений очень велик. Усредняя, мы получаем не характерную тенденцию, а «дырку от бублика»!
    У средних значений есть интересное свойство – они нивелируют индивидуальные различия. Поэтому усреднять имеет смысл тогда, когда мы имеем дело с показателями, не сильно отличающимися друг от друга. (Говоря о вариативности, как раз и подразумеваю статистический смысл этого термина – отличие значений в выборке от среднего.)

    На графики тоже смотрела. Вам кажется, что тенденция есть, мне кажется, что её нет :twisted: Чтобы понять объективное (насколько применимо это слово к статистике) положение дел, надо попробовать выявить тренд с помощью подходящего статистического критерия.

    Не знаю, что Вам советовал Валли (не открывается ссылка), но есть достаточно простой в применении и неприхотливый (не чувствительный к распределению данных) критерий Аббе.
    Стоит для начала, может быть, воспользоваться этим критерием, а затем уже (если результат будет положительным) построить помимо экспериментальных графиков собственно «линию тренда».

    Работу по сбору данных Вы провели колоссальную. Действительно, слов не хватает, чтобы выразить свой восторг :smile:

    Осталась, на самом деле, гораздо менее трудоемкая часть – правильная статистическая обработка этой информации. Она, конечно же, может ничего нового и не показать, но позволит немного отойти от субъективизма в оценке…

  49. 49. Sosnovskij | sosnovskij.ru | 9 Апрель 2013

    София, учитываются индивидуальные различия каждого места для конкретного запроса отношением количества ответов к среднему значению по ТОПу.

  50. 50. София | iPadTest.ru | 9 Апрель 2013

    Sosnovskij, во фрагменте таблицы — да. А как же с «глобальным» усреднением для каждой из 4-х рассмотренных категорий ( для графиков)? :smile:

  51. 51. Sosnovskij | sosnovskij.ru | 9 Апрель 2013

    София, если взять последнюю картинку в посте с цифрами и по столбцам высчитывать не среднее арифметическое, а просто сумму, то графики получаются практически идентичными.

  52. 52. София | iPadTest.ru | 10 Апрель 2013

    Sosnovskij, совершенно верно! Я и не предлагала вычислять суммы. Напротив, писала: «ни в коем случае, хотя это принципиально ничего не изменит (на графиках уменьшится масштаб по оси ординат).» При существенном различии величин их не надо ни усреднять, ни, тем более, суммировать!

    И потом, Сергей, почему Вы решили, что выбор при обработке данных ведется лишь между средним арифметическим и суммой :twisted:. Есть более сложные статистические инструменты, но, сейчас без них – никуда. А раз Вы интересуетесь анализом зависимостей, может быть, стоило бы их освоить. :smile:

    Но это я в качестве небольшого дополнения. Основное – это аплодисменты! Повторюсь, материал Вы собрали очень интересный, и статья получилась весьма информативной.

  53. 53. Sosnovskij | sosnovskij.ru | 10 Апрель 2013

    София, я не статист. Оперировал тем, чем мог :). На мой взгляд, данные расчеты могут показать приблизительную картину, которая может отражать реальную действительность, происходящую в поисковой выдаче. Возможно, более сложные расчеты и будут объективнее, но вряд ли они, например, развернут графики в обратную сторону или превратят их в горизонтальные линии.

Подняться наверхПодняться наверх
WordPress: 53.92MB | MySQL:30 | 0,871sec