9 июня 2010 года Google официально сообщил о завершении работы над
новой системой индексирования Google Caffeine. Новая система охватывает
большое количество страниц (100 млн. гигабайт пополняются со скоростью
несколько сотен тысяч гигабайт в день) и содержит на 50% больше свежей
информации. Благодаря ей, результаты работы веб-издателей быстрее
попадут в результаты поиска, а пользователь получит самую свежую
информацию по интересующей его теме.
Зачем
нужна новая система индексирования? Когда мы ищем в Google, мы ищем не
в реальной сети, а в индексе сайтов Google. Этот индекс,-- по старой
технологии больше похож на оглавление книги. Он состоял из нескольких
слоев, которые обновлялись с разной скоростью, в среднем, один раз в
две недели. В момент обновления индекса анализировалась все сеть, и
только после этого мы могли видеть нужную информацию в поиске Google.
Сейчас,
во-первых, количество информации в сети стремительно растет, а
во-вторых, кроме текста, мы ищем все больше разнообразного контента -
видео, изображения, документы. Структура сайтов становится все менее
однородной и более сложной по структуре. Все эти моменты учитывает
новая система Google Caffeine, которая позволит непрерывно по частям
обновлять индекс и предлагать для нас наиболее свежую информацию в
данный момент.
Система Google Caffeine, учитываая современные
тенденции поиска, нацелена на будущее Интернета -- гибкая многомерность
поиска обеспечит более быстрое и полное удовлетворение запросов
пользователя.
Этим летом Google обещал анонсировать еще ряд своих новинок.