Estrategia basada en el aprendizaje de máquina para tratar con conjuntos de datos no etiquetados usando conjuntos aproximados y/o ganancia de información

Luis Alexánder Calvo-Valverde

doi:10.18845/tm.v29i5.2581

PDF (Español (España))

Published: Jun 10, 2016

DOI: https://doi.org/10.18845/tm.v29i5.2581

Keywords:

Machine Learning, Data Mining, Rough Sets, Entropy, Information Gain, Feature Reduction

Luis Alexánder Calvo-Valverde

Abstract

As had been seen in the history of humanity, today data of various kinds and cheaply collected, for example sensors that record information every minute, web pages that store all the actions performed by the user on the page supermarkets that keep everything their customers buy and when to do it and many more examples like these. But these large databases have presented a challenge to their owners How to take advantage of them? How to turn data into information for decision making? This paper presents a strategy based on machine learning to deal with unlabeled datasets using rough sets and/or information gain. A method is proposed to cluster the data using k-means considering how much information provides an attribute (information gain); besides being able to select which attributes are really essential to classify new data and which are dispensable (rough sets), which is very beneficial as it allows decisions in less time.

How to Cite

Calvo-Valverde, L. A. (2016). Strategy based on machine learning to deal with untagged data sets using rough sets and/or information gain. Tecnología En Marcha Journal, 29(5), pág. 4–15. https://doi.org/10.18845/tm.v29i5.2581

Issue

Revista Tecnología en Marcha. Número Especial Matemática Aplicada 2016

Section

Artículo científico

Los autores conservan los derechos de autor y ceden a la revista el derecho de la primera publicación y pueda editarlo, reproducirlo, distribuirlo, exhibirlo y comunicarlo en el país y en el extranjero mediante medios impresos y electrónicos. Asimismo, asumen el compromiso sobre cualquier litigio o reclamación relacionada con derechos de propiedad intelectual, exonerando de responsabilidad a la Editorial Tecnológica de Costa Rica. Además, se establece que los autores pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.

Article Sidebar

Main Article Content

Abstract

Article Details