Algoritmo semisupervisado de agrupamiento que combina SUBCLU y el agrupamiento basado en restricciones, para la detección de grupos en conjuntos de alta dimensionalidad

Luis Alexander Calvo-Valverde; Alonso Vallejos-Peña

doi:10.18845/tm.v31i3.3904

PDF (Español (España))

Published: Jul 11, 2018

DOI: https://doi.org/10.18845/tm.v31i3.3904

Keywords:

Data mining, subspaces, SUBCLU, clustering, clustering by constraint

Luis Alexander Calvo-Valverde

Alonso Vallejos-Peña

Abstract

High dimensional data poses a challenge to traditional clustering algorithms, where the similarity measures are not meaningful, affecting the quality of the groups. As a result, subspace clustering algorithms have been proposed as an alternative, aiming to find all groups in all spaces of the dataset.

By detecting groups on lower dimensional spaces, each group may belong to different subspaces of the original dataset. Therefore, attributes the user considers of interest may be excluded in some or all groups, decreasing the value of the result for the data analysts.

In this project, a new algorithm is proposed, that combines SUBCLU and the clustering algorithms by constraint, which allows the users to identify variables as attributes of interest based on prior knowledge of domain, targeting direct group detection toward spaces that include user’s attributes of interest, and thereafter, generating more meaningful groups.

How to Cite

Calvo-Valverde, L. A., & Vallejos-Peña, A. (2018). Semisupervised clustering algorithm combining SUBCLU and constrained clustering for detecting groups in high dimensional datasets. Tecnología En Marcha Journal, 31(3), pág. 74–85. https://doi.org/10.18845/tm.v31i3.3904

Issue

Vol. 31, Núm. 3: Julio-Setiembre 2018

Section

Artículo científico

Los autores conservan los derechos de autor y ceden a la revista el derecho de la primera publicación y pueda editarlo, reproducirlo, distribuirlo, exhibirlo y comunicarlo en el país y en el extranjero mediante medios impresos y electrónicos. Asimismo, asumen el compromiso sobre cualquier litigio o reclamación relacionada con derechos de propiedad intelectual, exonerando de responsabilidad a la Editorial Tecnológica de Costa Rica. Además, se establece que los autores pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.

Article Sidebar

Main Article Content

Abstract

Article Details