Внутрішні фактори ранжирування

Сьогодні продовжую цикл статей по теорії SEO. У першій статті Релевантність — як вона розраховується пошуковими системами в Інтернеті, я розповів про загальні принципи алгоритмів ранжирування в пошукових системах в мережі інтернет.

Про внутрішні фактори або внутрішню оптимізацію написано чимало статей. Але сьогодні я хотів би зупиниться на теоретичній частині, щоб ви змогли вловити математичну залежність організації документа і його релевантності певному запиту.

Алгоритми пошукових систем досить складні і засновані в першу чергу на математиці. Саме тому в даному циклі я публікую математичні статті, щоб спробувати краще зрозуміти принцип роботи пошукових систем в мережі Інтернет.

Умовна формули розрахунку релевантності має вигляд:

Значення величини — релевантності внутрішніх факторів ранжирування, визначається як релевантність вихідного коду документа запиту . Вихідний код сторінки — це набір команд браузера, використовуваних для відображення вмісту сторінки, а так само текст і метаданні. Умовна формула для розрахунку даного показника може бути записана в такий спосіб. де — релевантність -першого фактору внутрішнього ранжирування;

— кількість словоформ, що збіглися зі словоформами запиту в -м факторі внутрішнього ранжирування;

— загальна кількість словоформ в -м факторі внутрішнього ранжирування;

— ваговий коефіцієнт фактору внутрішнього ранжирування;

— безліч словоформ, використовуваних в факторі внутрішнього ранжирування;

— кількість словоформ, використовуваних в факторі внутрішнього ранжирування;

— загальна кількість словоформ, використовуваних у факторах внутрішнього ранжирування;

— загальна кількість внутрішніх факторів ранжирування в коді сторінки .

На значення впливає розташування шуканого тексту на сторінці і частота зустрічальності слів запиту в розглянутому документі, тобто частка слів з тексту запиту в загальній кількості слів документа. Більшу вагу мають слова, розташовані ближче до початку документа. Особливо цінується точне входження тексту запиту в текст документа. Слід зазначити, що пошук по стоп-словах (частки) не виробляється, але вони враховуються при ранжируванні документів, що може серйозно впливати на результат видачі.

Те ж саме можна сказати і про морфологію запиту. ПС віддають перевагу однаковій формі слів у тексті запиту і тексті документа. Для Google це мало принципове значення доти, поки ця ПС не початку підтримувати російську морфологію.

Іншим внутрішнім фактором ранжирування є частота вживання слів у документі. Не існує визначення «ідеальної» щільності слів у документі хоча б тому, що в кожної ПС вона буде своя. Існують лише рекомендації про щільність ключових слів на сторінці в межах 3-7%. В теорії пошукових систем це називають семантичним ядром.

До елементів форматування тексту ставляться наступні html-теги:

· <h1>,…,<h6> – заголовки сторінок;

· <strong> – акцентування тексту;

· <b> – виділення тексту жирним;

· <i> – курсив.

Службові теги keywords і description активно використовувалася багатьма пошуковими системами.

Але у зв’язку з тим, що їхній зміст не видно користувачеві на екрані браузера, вони стали діючим інструментом для обману пошукових систем, що привело до того, що в цей час вплив цих позначка тегів незначно або відсутній. Наприклад, Google при ранжируванні документів їх ігнорують взагалі, але використає вміст позначки-тегу description при побудові сніппетів — фрагментів тексту, що містять слова із запиту, видаваних поруч із посиланням на документ в результатах пошуку. На сайті Яндекса зазначено, що він ураховує перші 50 слів з тегу keywords при умові, що це слово присутнє в тексті сторінки.

Найбільший ефект зі сторінкових факторів дає застосування тега title — заголовка сторінки.

Причому використати в ньому можна навіть слова, які не втримуються в тексті сторінки — це теж дає ефект, хоча і менший, але в деяких випадках це виправдано. До тексту усередині цього тэга застосовні ті же поняття, що і для тексту документа взагалі: більшу вагу мають слова, розташовані ближче до початку, дуже ефективно точне входження шуканої фрази. Судячи з інформації представленої на сайтах Яндекса, ця ПС не враховує частоту входження слів із запиту в цьому тегу, а тільки факт їх присутності. Недоцільно робити дуже довгі словосполучення в тегі title, тому що ПС можуть накладати обмеження на довжину індексованої частини цього тегу.

Атрибут alt тегу img. — це текстовий коментар до зображень. Для Яндекса цей атрибут має значення тільки при пошуку по картинках, а при ранжируванні документів в основному пошуку не використається. Google ураховує вміст цього атрибута тільки для зображень, що є посиланнями.

У більшості випадків при аналізі позицій сайту у видачі важко виділити вплив як внутрішніх, так і інших факторів. Але ефект кожного з факторів неважко простежити в крайових ситуаціях, коли вплив інших факторів украй мало або відсутній. Для початку можна поэкспериментировать із внутрішніми факторами ранжирування і простежити позиції, щоб зрозуміти, як вони впливають напозиции.

Внутрішні фактори ранжирування

Умовна формули розрахунку релевантності має вигляд:

До елементів форматування тексту ставляться наступні html-теги:

Схожі статті: