Разбиение документов на зоны, отличие зон от полей метаинформации, использование информации о зонах для вычисления релевантности. Организация индекса с учётом информации о зонах. Учёт количества терминов в документе и в массиве документов. Ранжирование tf-idf, его достоинства и недостатки. Модификации tf-idf. Модель векторного пространства, мера близости двух документов. Ранжирование документов в векторном пространстве, выполнение поискового запроса. Эвристики, позволяющие сократить время выполнения запроса. Достоинства и недостатки модели. Языковые модели в поиске. Статистический поиск, BIM. BM25.