Лекция №8

Ранжирование. Поисковая система целиком

Разбиение документов на зоны, отличие зон от полей метаинформации, использование информации о зонах для вычисления релевантности. Организация индекса с учётом информации о зонах. Учёт количества терминов в документе и в массиве документов. Ранжирование tf-idf, его достоинства и недостатки. Модификации tf-idf. Модель векторного пространства, мера близости двух документов. Ранжирование документов в векторном пространстве, выполнение поискового запроса. Эвристики, позволяющие сократить время выполнения запроса. Достоинства и недостатки модели. Языковые модели в поиске. Статистический поиск, BIM. BM25.

  • Алексей Воропаев Алексей Воропаев
Другие видеозаписи
Все видео

© VK, 2011–2025

Обратная связь

Присоединяйся:

Группа VK
  • Разработка:
    Команда
    VK Education
Версия портала - 5.86.2