Term-Frequency (TF) 

La Term-Frequency (TF) est une méthode qui mesure la fréquence à laquelle un mot apparaît dans un document. Cela aide à identifier les mots importants dans un texte. Plus un mot apparaît fréquemment, plus il est considéré comme important pour ce document.

Exemple

Document : « Le chat aime le poisson et le lait. »

  • Le mot « le » apparaît 3 fois.
  • Les mots « chat », « aime », « et », « poisson », « lait » apparaissent chacun 1 fois.

La fréquence de chaque mot est ensuite utilisée pour représenter le document sous forme numérique. Dans cet exemple, « le » est plus fréquent et donc plus important selon cette technique simple. Ce qui peut conduire à de fausses interprétations. Cet exemple montre les limites de cette technique.