Hogar Finanzas personales Hadoop MapReduce para Big Data - dummies

Hadoop MapReduce para Big Data - dummies

Tabla de contenido:

Video: Hadoop MapReduce Example | MapReduce Programming | Hadoop Tutorial For Beginners | Edureka 2025

Video: Hadoop MapReduce Example | MapReduce Programming | Hadoop Tutorial For Beginners | Edureka 2025
Anonim

Para comprender completamente las capacidades de Hadoop MapReduce, es importante diferenciar entre MapReduce (el algoritmo) y implementación de MapReduce. Hadoop MapReduce es una implementación del algoritmo desarrollado y mantenido por el proyecto Apache Hadoop.

Es útil pensar en esta implementación como un motor MapReduce, porque así es exactamente como funciona. Proporciona entrada (combustible), el motor convierte la entrada en salida de manera rápida y eficiente, y obtiene las respuestas que necesita.

Hadoop MapReduce incluye varias etapas, cada una con un conjunto importante de operaciones que ayudan a alcanzar su objetivo de obtener las respuestas que necesita de grandes volúmenes de datos. El proceso comienza con una solicitud del usuario para ejecutar un programa MapReduce y continúa hasta que los resultados se escriben nuevamente en el HDFS.

HDFS y MapReduce realizan su trabajo en nodos en un clúster alojado en bastidores de servidores de productos. Para simplificar la discusión, el diagrama muestra solo dos nodos.

Prepare los big data

Cuando un cliente solicita la ejecución de un programa MapReduce, el primer paso es localizar y leer el archivo de entrada que contiene los datos sin formato. El formato de archivo es completamente arbitrario, pero los datos deben convertirse a algo que el programa pueda procesar. Esta es la función de InputFormat y RecordReader. InputFormat decide cómo se dividirá el archivo en partes más pequeñas para su procesamiento mediante una función llamada InputSplit.

A continuación, asigna un RecordReader para transformar los datos sin formato para que el mapa los procese. Varios tipos de RecordReaders se suministran con Hadoop, que ofrece una amplia variedad de opciones de conversión. Esta característica es una de las formas en que Hadoop administra la gran variedad de tipos de datos que se encuentran en los problemas de big data.

Permite que comience el mapa de big data

Tus datos ahora están en una forma aceptable para mapear. Para cada par de entrada, se llama a una instancia distinta de mapa para procesar los datos. Pero, ¿qué hace con el resultado procesado y cómo puede hacer un seguimiento de ellos?

Map tiene dos capacidades adicionales para abordar las preguntas. Debido a que el mapa y la reducción necesitan trabajar en conjunto para procesar sus datos, el programa necesita recolectar el resultado de los mapeadores independientes y pasarlo a los reductores. Esta tarea la realiza un OutputCollector. Una función Reporter también proporciona información recopilada de las tareas del mapa para que sepa cuándo se completan las tareas del mapa o si.

Todo este trabajo se realiza en múltiples nodos en el cluster de Hadoop simultáneamente.Es posible que haya casos en los que deba acumularse el resultado de ciertos procesos de mapeo antes de que los reductores puedan comenzar. O bien, algunos de los resultados intermedios pueden necesitar procesarse antes de la reducción.

Además, parte de esta salida puede estar en un nodo diferente del nodo donde se ejecutarán los reductores para esa salida específica. La recopilación y la mezcla de resultados intermedios se realizan mediante un particionador y un género. Las tareas del mapa entregarán los resultados a una partición específica como entradas a las tareas de reducción.

Después de que se hayan completado todas las tareas del mapa, los resultados intermedios se recopilan en la partición y se produce una mezcla, clasificando la salida para un procesamiento óptimo por reducir.

Reducir y combinar para datos grandes

Para cada par de salida, se llama a reducir para realizar su tarea. De forma similar a la del mapa, reduce la producción mientras se procesan todas las tareas. Reducir no puede comenzar hasta que todo el mapeo esté hecho. La salida de reduce también es una clave y un valor. Si bien esto es necesario para que reduzca su trabajo, puede que no sea el formato de salida más efectivo para su aplicación.

Hadoop proporciona una función OutputFormat, y funciona muy parecido a InputFormat. OutputFormat toma el par clave-valor y organiza la salida para escribir en HDFS. La última tarea es escribir los datos en HDFS. Esto es realizado por RecordWriter, y se desempeña de manera similar a RecordReader, excepto en reversa. Toma los datos de OutputFormat y los escribe en HDFS en la forma necesaria para los requisitos del programa.

La coordinación de todas estas actividades se gestionó en versiones anteriores de Hadoop mediante un programador de tareas. Este programador era rudimentario y, a medida que la combinación de trabajos cambiaba y crecía, era evidente que era necesario un enfoque diferente. La deficiencia principal en el programador antiguo era la falta de gestión de recursos. La última versión de Hadoop tiene esta nueva capacidad.

Hadoop MapReduce es el corazón del sistema Hadoop. Proporciona todas las capacidades que necesita para dividir los grandes datos en fragmentos manejables, procesar los datos en paralelo en su clúster distribuido y luego poner los datos a disposición para el consumo del usuario o el procesamiento adicional. Y hace todo este trabajo de una manera muy resistente y tolerante a fallas. Este es solo el comienzo.

Hadoop MapReduce para Big Data - dummies

Selección del editor

Cómo ubicar los comandos en el navegador de comandos de NaturallySpeaking con el filtro de palabras clave - dummies

Cómo ubicar los comandos en el navegador de comandos de NaturallySpeaking con el filtro de palabras clave - dummies

Buscando en la web, puede encontrar comandos en el Explorador de comandos de NaturallySpeaking utilizando palabras clave. El filtro de palabras clave hace que sea fácil encontrar el comando real para una función que le gustaría realizar. Por ejemplo, si desea ubicar una nota al pie en su documento de Word, su primera inclinación podría ser ...

Cómo instalar Dragon NaturallySpeaking en su computadora - Dummies

Cómo instalar Dragon NaturallySpeaking en su computadora - Dummies

Si está instalando NaturallySpeaking por primera vez o instalando sobre una versión anterior, el proceso es fácil. Si tiene perfiles de usuario de NaturallySpeaking versión 10 u 11, el Asistente de actualización encuentra esos perfiles de usuario y los configura en la versión 12. De lo contrario, se le guiará a través de la creación de un nuevo perfil de usuario. Siga ...

Cómo navegar entre las aplicaciones de PC abiertas con Dragon Professional Individual - muñecos

Cómo navegar entre las aplicaciones de PC abiertas con Dragon Professional Individual - muñecos

Una vez que te metes el calor de la jornada laboral, es probable que tenga varias aplicaciones abiertas en su PC y otras que desee abrir. No quiere tener que comprometerlos con la memoria; solo ordene con su voz. Aquí hay algunos comandos para navegar en sus aplicaciones una vez que tenga Dragon Professional Individual ...

Selección del editor

Crear panorámicas de imágenes con Photomerge en Photoshop Elements 9 - dummies

Crear panorámicas de imágenes con Photomerge en Photoshop Elements 9 - dummies

El comando Photomerge Panorama le permite combinar múltiples imágenes en una sola imagen panorámica. Desde los horizontes hasta las cadenas montañosas, puedes tomar varias tomas superpuestas y unirlas en una sola. Para tener éxito en la fusión de fotos en una panorámica, debe comenzar con buenos archivos fuente. Antes que nada, asegúrese de que ...

Personalizar presets en Photoshop Elements 10 - dummies

Personalizar presets en Photoshop Elements 10 - dummies

Parte de la diversión de la edición de imágenes es elegir brochas, muestras de colores , degradado de colores y patrones para crear el aspecto que desee. Para comenzar, Elements le proporciona una serie de bibliotecas preestablecidas que puede cargar y usar cuando lo desee. Por ejemplo, puede cargar una biblioteca de pinceles para adquirir ...

Creación-Conceptos básicos de ensamblaje para Photoshop Elements 10 - dummies

Creación-Conceptos básicos de ensamblaje para Photoshop Elements 10 - dummies

Creaciones en Photoshop Elements 10 como álbumes de fotos, los collages fotográficos, los calendarios fotográficos, las tarjetas de felicitación y las PhotoStamps están diseñadas para imprimir o compartir pantallas. Cuando realice una creación que finalmente se enviará a un servicio en línea para su impresión o se compartirá con otros usuarios, tenga en cuenta que primero debe ...

Selección del editor

Slide Master y Edit Master Tabs en PowerPoint 2013 - Dummies

Slide Master y Edit Master Tabs en PowerPoint 2013 - Dummies

Cuando cambia a Slide Master Ver en PowerPoint 2013, aparece una pestaña completamente nueva en la cinta de opciones. Esta nueva pestaña se llama apropiadamente Slide Master. Aquí hay una descripción general rápida de cada grupo en esta pestaña y los controles que se encuentran en ellos: Editar maestro: los controles de este grupo le permiten editar el Patrón de diapositivas. ...

Comprensión de PowerPoint 2013 Atajos de presentación de diapositivas: variables ficticias

Comprensión de PowerPoint 2013 Atajos de presentación de diapositivas: variables ficticias

PowerPoint 2013 está diseñado para crear diapositivas que se presentan directamente en una pantalla en lugar de impreso. La pantalla puede ser el monitor de su computadora, un proyector o un monitor externo, como un televisor de pantalla gigante. En la mayoría de los casos, la configuración predeterminada para mostrar una presentación es adecuada. Sin embargo, en algunos casos, puede ...

Use PowerPoint 2007 Notes - dummies

Use PowerPoint 2007 Notes - dummies

PowerPoint Notes son como un adjunto adjunto a sus diapositivas. No aparecen en las diapositivas de PowerPoint. Cada diapositiva en su presentación de PowerPoint tiene su propia página de notas que se muestra por separado. Las notas generalmente se ocultan en la parte inferior de la pantalla en un pequeño panel de Notas de PowerPoint. Para trabajar con notas, usted ...