Please use this identifier to cite or link to this item: http://www.dspace.espol.edu.ec/handle/123456789/20627
Title: Evaluacion, análisis y comparación del rendimiento de programas de procesamiento masivo implementados usando lenguajes de programación java, python y c++ sobre la plataforma hadoop para clusteres
Authors: Mendozasaltos, Mayra
Trujillo Miranda, Betsy
Issue Date: 27-Mar-2012
Abstract: En el presente trabajo se exhibe el análisis del rendimiento de lenguajes de programación tales como Java, C++ y Python sobre la plataforma Hadoop. Para su evaluación se han implementado cuatro programas típicos de procesamiento masivo de datos. El documento se ha dividido en cuatro capítulos que comprende desde fundamento teórico hasta las soluciones y los resultados obtenidos. En el Capítulo 1 se describe la necesidad de obtener un criterio de partida al momento de elegir un lenguaje de programación para resolver una tarea específica, se detallan los objetivos planteados y el alcance del presente trabajo. En el Capítulo 2 se introduce el concepto de Hadoop como plataforma de procesamiento masivo de datos y los complementos empleados tales como Streaming y Pipes. En el Capítulo 3 se detallan los problemas planteados, las soluciones dadas, así como los formatos de entrada/salida y las librearías usadas. Finalmente en el Capítulo 4 se detallan los resultados obtenidos y se realiza la comparación y el análisis de los mismos.
URI: http://www.dspace.espol.edu.ec/handle/123456789/20627
Appears in Collections:Tesis de Grado - FIEC

Files in This Item:
File Description SizeFormat 
D-90946.pdf1.08 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.