,

The State of Record Linkage and Current Research Problems

.
Statistical Research Report Series RR99/04. U.S. Bureau of the Census, Washington, D.C., (1999)

Аннотация

Describe los fundamentos de la medida de similitud entre cadenas Jaro-Winkler basada, a su vez, en la medida de Jaro que comparaba caracteres coincidentes dentro de una ventana de tamaño la mitad del tamaño de la menor cadena y el orden en que aparecen, pero añadiendo la coincidencia de los prefijos. Esta medida funciona bien para cadenas pequeñas como por ejemplo nombres propios.

тэги

Пользователи данного ресурса

  • @asalber
  • @pirot
  • @sam_chapman

Комментарии и рецензии