GoogleПошуковики використовують певний список операцій, який дозволяє їм забезпечити релевантні результати у видачі.

  1. Просування по мережі

 Пошуковики використовують автоматичні програми, іменовані ботами або спайдера, які використовують гіпертекстову структуру мережі для проходження по сторінках і документах, які складають Всесвітню павутину. Існує приблизно 20 мільярдів сторінок, пошуковики вивчили від 8 до 10 мільярдів.

  1. Індексація документів

Після проходження сторінки її контент може бути проіндексований, тобто збережений в величезній базі даних документів, яка складає “index” пошукової системи. Управління індексом повинно проводитися таким чином, що запити, за якими проводиться пошук і сортування мільярдів документів, повинні бути оброблені за частки секунди.

  1. Обробка запитів в Гугл

Коли запит на інформацію надходить до пошуковика (сотні мільйонів кожен день), він витягує зі свого індексу всі документи, які відповідають запиту. Відповідність визначається, якщо слова або фраза знаходяться на сторінці у вигляді, визначеному користувачем. Наприклад, за запитом компьютер в Google виводяться 163 мільйонів результатів. Проте пошук тієї ж фрази в лапках призведе до видачі тільки 166 000 результатів. У першій системі, яка іменується режим “Findall”, Google витягує всі документи, які мають слова “компьютер”, “компьютери” і “компьютери” (Google ігнорує слово “і”, оскільки обмеження результатів пошуку не є ефективним). У другому запиті “домашній компьютер” були видані лише сторінки, точно відповідні набраному запитом. Інші пошуковики можуть мати інші алгоритми для видачі відповідних запитом результатів (У Google є список з 11 операторів).

  1. Ранжування результатів

Після визначення пошуковиком результатів, які відповідають запиту алгоритм пошуку (математичне рівняння, що використовується для пошуку) проводить розрахунок по кожному результату пошуку для визначення найбільш релевантного запиту результату. Сортування результатів видачі проводиться в порядку убування ступеня релевантності результатів запиту. Хоча операції пошукачів не є особливо довгими, пошукові системи, такі як Google, Yahoo!, AskJeeves і MSN є одними з найскладніших комп’ютерів в світі. Вони виробляють мільйони розрахунків кожну секунду і обробляють інформаційні запити величезних груп користувачів.