Abstract:
RESUMEN: Generalmente cuando se usan medidas de similitud y disimilitud para áreas como Minería de Datos, Machine Learning, Química Computacional, entre otros no se estudia cuales son las propiedades que dichas medidas de similitud y di- similitud cumplen, aun menos cual es su dominio y co-dominio en la presente investigación se tiene una breve descripción de nueve medidas de similitud y disimilitud, sus características y las áreas donde tienen mejor desempeño, teniendo en cuenta que dichas medidas de similitud y disimilitud su principal característica es que su co-dominio se encuentra en el conjunto (0,1). Al mismo tiempo se estudian métodos para crear nuevas funciones de disimilitud y correlación, la función de disimilitud que se propone pretende arreglar el problema de indeterminación que surge al usar la medida de disimilitud Kulczynski y también se crean medidas de correlación que cumplen con la propiedad fuerte de correlación y otras con la propiedad de correlación débil. También se hace un estudio de la correlación que existe entre dichas medidas de similitud, y en las medidas de disimilitud que se estudiaron y las que se presentan en la presente investigación.
ABSTRACT: Generally, when similarity and dissimilarity measures are used for areas such as Data Mining, Machine Learning, Computational Chemistry, among others, it is not studied what are the properties that these similarity and dissimilarity measures fulfill, even less what is their domain and co-domain In this research there is a brief description of nine measures of similarity and dissimilarity, their characteristics and the areas where they perform better, noticing that similarity measure and dissimilarity measure, their main characteristic is that their co-domain is in the set (0,1). At the same time, methods are studied to create new dissimilarity and correlation functions, the proposed dissimilarity function aims to fix the indeterminacy problem that arises when using the Kulczynski dissimilarity measure and correlation measures are also created that comply with the property strong correlation and others with weak correlation property. A study is also made of the correlation that exists between these similarity measures, and in the dissimilarity measures that were studied and those that are presented in the present investigation.
Description:
Tesis (Maestría en Ciencias de la Computación), Instituto Politécnico Nacional, CIC, 2021, 1 archivo PDF, (87 páginas). tesis.ipn.mx