Caffeine будет обладать наибольшим объемом интернет-контента среди
всех систем индексирования, использовавшихся поисковиком ранее. При
этом, как обещает Google, обновление индекса будет происходить быстрее,
чем раньше. Таким образом, пользователи смогут быстрее находить ссылки
на новые сайты в поисковой выдаче.
В записи в блоге объясняется, что предыдущая версия индекса состояла
из нескольких слоев, которые обновлялись с различной периодичностью.
Так, основной слой обновлялся в среднем раз в две недели. Новый индекс
будет анализировать интернет-сайты на постоянной основе небольшими
фрагментами.
Отмечается, что общий объем базы данных Caffeine превышает 100
миллионов гигабайт (100 петабайт). При этом каждый день в индекс
добавляется несколько сотен тысяч гигабайт новых данных.