ISBN-13: 9783841723536 / Portugalski / Miękka / 2016 / 68 str.
Este trabalho teve como objetivo investigar a utilização de um algoritmo de agrupamento K-Means paralelo, com base no modelo de programação MapReduce, para melhorar o tempo de resposta da mineração de dados. O desempenho do algoritmo foi avaliado quanto ao SpeedUp e ScaleUp. Para isso foram executados experimentos em um cluster Hadoop formado por seis computadores de hardware comum. Os dados agrupados são medições de torres de fluxo de regiões agrícolas e pertencem a Ameriflux. Os experimentos foram executados usando 3, 4 e 6 máquinas, respectivamente. Os resultados mostraram que com o aumento do número de máquinas houve ganho no desempenho, sendo que o melhor tempo obtido foi usando seis máquinas, chegando ao SpeedUp de 3,25. Verificou-se que a aplicação escala bem com o aumento equivalente do tamanho dos dados e do número de máquinas no cluster, atingindo um desempenho próximo nos testes.