Лекция №3

Основы обработки текстов

Выбор единицы индексирования (документа). Предварительная обработка документов, разбиение на слова, выделение терминов, нормализация, стоп-словарь. Характерные особенности текстов, написанных на естественных языках: омонимия, компаунды, морфология. Основные подходы к морфологической обработке.

  • Игорь Андреев Игорь Андреев
Другие видеозаписи
Все видео

© VK, 2011–2025

Обратная связь

Присоединяйся:

Группа VK
  • Разработка:
    Команда
    VK Education
Версия портала - 5.86.3