COMA: a system for flexible combination of schema matching approaches
H. Do, and E. Rahm. Proceedings of the 28th international conference on Very Large Data Bases, page 610--621. Hong Kong, China, VLDB Endowment, (2002)
Abstract
COMA (Combining Match) es un sistema de detección de correspondencias entre esquemas (bases de datos u ontologías) basado en la combinación de distintas técnicas o algoritmos.
Funciona iterativamente en tres etapas que pueden reiterarse:
1- Retroalimentación del usuario. Esta fase es opcional y permite que el usuario establezca correspondencias que después influirán en el cálculo de nuevas correspondencias en las siguientes etapas.
2- Utilización de distintos algoritmos de cálculo de similitudes para cada par de entidades de los esquemas. Se utilizan distintos tipos de algoritmos: sufijos, afijos, n-gramas, distancia de edición, fonéticos, sinónimos, tipos de datos, relaciones taxonómicas y correspondencias con terceros esquemas.
Las medidas de similitud de cada algoritmo para cada par de entidades se organizan en un cubo de similitudes.
3- Combinación de similitudes. Para cada par de entidades de los esquemas se agregan las medidas de similitud de los diferentes algoritmos utilizados. Se utiliza el máximo, el mínimo y la media ponderada como posibles medidas de agregación. Después se ordenan los candidatos por similitudes y se seleccionan los candidatos de acuerdo a distintos filtros: los n candidatos más parecidos, los candidatos que estén a una distancia d menor del más parecido, y los que superen un determinado umbral de similitud.
La evaluación de las correspondencias obtenidas se realiza comparando con correspondencias hechas a mano mediante las medidas de precisión, recuerdo, y una combinación de ambas.
La combinación de algoritmos y la reutilización de correspondencias externas mejora sensiblemente los resultados.
%0 Conference Paper
%1 hong-hai2002coma
%A Do, Hong-Hai
%A Rahm, Erhard
%B Proceedings of the 28th international conference on Very Large Data Bases
%C Hong Kong, China
%D 2002
%I VLDB Endowment
%K 2 matching systems ontology-alignment
%P 610--621
%T COMA: a system for flexible combination of schema matching approaches
%U http://portal.acm.org/citation.cfm?id=1287369.1287422
%X COMA (Combining Match) es un sistema de detección de correspondencias entre esquemas (bases de datos u ontologías) basado en la combinación de distintas técnicas o algoritmos.
Funciona iterativamente en tres etapas que pueden reiterarse:
1- Retroalimentación del usuario. Esta fase es opcional y permite que el usuario establezca correspondencias que después influirán en el cálculo de nuevas correspondencias en las siguientes etapas.
2- Utilización de distintos algoritmos de cálculo de similitudes para cada par de entidades de los esquemas. Se utilizan distintos tipos de algoritmos: sufijos, afijos, n-gramas, distancia de edición, fonéticos, sinónimos, tipos de datos, relaciones taxonómicas y correspondencias con terceros esquemas.
Las medidas de similitud de cada algoritmo para cada par de entidades se organizan en un cubo de similitudes.
3- Combinación de similitudes. Para cada par de entidades de los esquemas se agregan las medidas de similitud de los diferentes algoritmos utilizados. Se utiliza el máximo, el mínimo y la media ponderada como posibles medidas de agregación. Después se ordenan los candidatos por similitudes y se seleccionan los candidatos de acuerdo a distintos filtros: los n candidatos más parecidos, los candidatos que estén a una distancia d menor del más parecido, y los que superen un determinado umbral de similitud.
La evaluación de las correspondencias obtenidas se realiza comparando con correspondencias hechas a mano mediante las medidas de precisión, recuerdo, y una combinación de ambas.
La combinación de algoritmos y la reutilización de correspondencias externas mejora sensiblemente los resultados.
@inproceedings{hong-hai2002coma,
abstract = {COMA (Combining Match) es un sistema de detección de correspondencias entre esquemas (bases de datos u ontologías) basado en la combinación de distintas técnicas o algoritmos.
Funciona iterativamente en tres etapas que pueden reiterarse:
1- Retroalimentación del usuario. Esta fase es opcional y permite que el usuario establezca correspondencias que después influirán en el cálculo de nuevas correspondencias en las siguientes etapas.
2- Utilización de distintos algoritmos de cálculo de similitudes para cada par de entidades de los esquemas. Se utilizan distintos tipos de algoritmos: sufijos, afijos, n-gramas, distancia de edición, fonéticos, sinónimos, tipos de datos, relaciones taxonómicas y correspondencias con terceros esquemas.
Las medidas de similitud de cada algoritmo para cada par de entidades se organizan en un cubo de similitudes.
3- Combinación de similitudes. Para cada par de entidades de los esquemas se agregan las medidas de similitud de los diferentes algoritmos utilizados. Se utiliza el máximo, el mínimo y la media ponderada como posibles medidas de agregación. Después se ordenan los candidatos por similitudes y se seleccionan los candidatos de acuerdo a distintos filtros: los n candidatos más parecidos, los candidatos que estén a una distancia d menor del más parecido, y los que superen un determinado umbral de similitud.
La evaluación de las correspondencias obtenidas se realiza comparando con correspondencias hechas a mano mediante las medidas de precisión, recuerdo, y una combinación de ambas.
La combinación de algoritmos y la reutilización de correspondencias externas mejora sensiblemente los resultados. },
added-at = {2009-06-22T17:44:00.000+0200},
address = {Hong Kong, China},
author = {Do, Hong-Hai and Rahm, Erhard},
biburl = {https://www.bibsonomy.org/bibtex/2e2b435f1a7cd2d0018aa34ed415b8c84/asalber},
booktitle = {Proceedings of the 28th international conference on Very Large Data Bases},
interhash = {1e5c80af6ad93ec5c46e8be9252088b5},
intrahash = {e2b435f1a7cd2d0018aa34ed415b8c84},
keywords = {2 matching systems ontology-alignment},
pages = {610--621},
publisher = {VLDB Endowment},
timestamp = {2012-06-07T11:07:57.000+0200},
title = {COMA: a system for flexible combination of schema matching approaches},
url = {http://portal.acm.org/citation.cfm?id=1287369.1287422},
year = 2002
}