Hogar Finanzas personales Ejecutando aplicaciones antes de Hadoop 2 - dummies

Ejecutando aplicaciones antes de Hadoop 2 - dummies

Video: How to Setup Multinode Hadoop 2 on CentOS/RHEL Using VirtualBox 2025

Video: How to Setup Multinode Hadoop 2 on CentOS/RHEL Using VirtualBox 2025
Anonim

Debido a que muchas implementaciones de Hadoop existentes todavía no están utilizando aún otro negociador de recursos (YARN), eche un vistazo rápido a cómo Hadoop administró su procesamiento de datos antes de los días de Hadoop 2. Concéntrese en la función que los daemons maestros JobTracker y los daemons esclavos TaskTracker jugaron en el manejo del procesamiento de MapReduce.

El objetivo de emplear sistemas distribuidos es poder desplegar los recursos informáticos en una red de computadoras autónomas de una manera que sea tolerante a fallas, fácil y de bajo costo.

En un sistema distribuido como Hadoop, donde tiene un clúster de nodos informáticos autónomos, todos trabajando en paralelo, una gran complejidad consiste en garantizar que todas las piezas funcionen juntas. Como tales, estos sistemas suelen tener distintas capas para manejar diferentes tareas para soportar el procesamiento paralelo de datos.

Este concepto, conocido como separación de preocupaciones, asegura que si usted es, por ejemplo, el programador de la aplicación, no necesita preocuparse por los detalles específicos para, por ejemplo, la conmutación por error de tareas de mapa. En Hadoop, el sistema consta de estas cuatro capas distintas, como se muestra:

  • Almacenamiento distribuido: El Sistema de archivos distribuidos Hadoop (HDFS) es la capa de almacenamiento donde se almacenan los datos, los resultados intermedios y los conjuntos de resultados finales.

  • Gestión de recursos: Además del espacio en disco, todos los nodos esclavos del clúster Hadoop tienen ciclos de CPU, RAM y ancho de banda de red. Un sistema como Hadoop debe poder parcelar estos recursos para que múltiples aplicaciones y usuarios puedan compartir el clúster de manera predecible y sintonizable. Este trabajo lo realiza el daemon JobTracker.

  • Marco de procesamiento: El flujo de proceso de MapReduce define la ejecución de todas las aplicaciones en Hadoop 1. Esto comienza con la fase del mapa; continúa con la agregación con shuffle, sort o merge; y termina con la fase de reducción. En Hadoop 1, esto también es administrado por el daemon JobTracker, con la ejecución local administrada por daemons TaskTracker que se ejecutan en los nodos esclavos.

  • Interfaz de programación de aplicaciones (API): Las aplicaciones desarrolladas para Hadoop 1 deben codificarse utilizando la API de MapReduce. En Hadoop 1, los proyectos Hive y Pig proporcionan a los programadores interfaces más fáciles para escribir aplicaciones de Hadoop y, debajo del capó, su código se compila en MapReduce.

En el mundo de Hadoop 1 (que era el único mundo que tenía hasta hace muy poco), todo el procesamiento de datos giraba en torno a MapReduce.

Ejecutando aplicaciones antes de Hadoop 2 - dummies

Selección del editor

Cómo usar los menús Nikon D90 - muñecos

Cómo usar los menús Nikon D90 - muñecos

Usando una SLR digital le permite usar las mejores técnicas fotográficas de una cámara manual, o aprovechar las funciones avanzadas de una cámara. Accedes a muchas de las características de tu D90 a través de los menús internos, que se explican aquí. Los menús Nikon D90, de manera conveniente, aparecen cuando presiona el botón Menú. Las funciones se agrupan en seis ...

Cómo usar el modo Guía en su Nikon D3200 - muñecos

Cómo usar el modo Guía en su Nikon D3200 - muñecos

Su Nikon D3200 ofrece seis modos de escena automáticos , que seleccionan configuraciones diseñadas para capturar escenas específicas de maneras que tradicionalmente se consideran mejores desde un punto de vista creativo (Retrato, Paisaje, Niño, Primer plano, Deportes, Retrato nocturno). Pero si quiere más, la opción de Operación avanzada disponible en el modo Guía hace que sea fácil jugar con ...

Cómo utilizar los menús guiados Nikon D3300 - maniquíes

Cómo utilizar los menús guiados Nikon D3300 - maniquíes

Presionando el botón de menú Nikon D3300 le da acceso a un montón de opciones además de las que controla a través de los botones y diales externos. Pero qué tipo de pantallas de menú ve depende de la configuración del dial de modo: Guía: Al presionar el botón Menú, aparece la primera pantalla de la guía ...

Selección del editor

Practicar preguntas de Matemáticas para Praxis: área y circunferencia de círculos: maniquíes

Practicar preguntas de Matemáticas para Praxis: área y circunferencia de círculos: maniquíes

Cuando tomes En el examen básico de Praxis, vale la pena tener un conocimiento completo de los círculos, especialmente su área y circunferencia. En las siguientes preguntas de práctica, trabajas tanto hacia atrás (encontrar el radio de un círculo dada su circunferencia) como hacia adelante (encontrar el área de un círculo dado su radio). Preguntas de práctica Un círculo tiene una circunferencia de 20π in. ...

Una descripción general de la educación elemental de Praxis Examen 5017 - dummies

Una descripción general de la educación elemental de Praxis Examen 5017 - dummies

La escuela primaria Praxis Educación: plan de estudios, El examen de Instrucción y Evaluación (5017) usa 120 preguntas para evaluar el desarrollo curricular, la instrucción y las habilidades de evaluación en cinco grupos de asignaturas: Lectura y artes del lenguaje Matemáticas Ciencias Estudios sociales Arte, música y educación física Las 120 preguntas del examen se dividen en cinco grupos de asignaturas según estas proporciones: ...

Practica preguntas de Matemáticas para Praxis: Conversión de Fracciones - tontos

Practica preguntas de Matemáticas para Praxis: Conversión de Fracciones - tontos

A veces está bien ser inapropiado. Ejemplo: el examen básico de Praxis, donde se le puede pedir que convierta fracciones entre sus formas mixtas, simples e impropias. En las siguientes preguntas de práctica, comienzas con una forma simplificada de una fracción y tienes que encontrar el original, y luego comienzas con una mezcla ...

Selección del editor

Máquina Aprendiendo con Mahout en Hadoop - dummies

Máquina Aprendiendo con Mahout en Hadoop - dummies

Aprendizaje automático se refiere a una rama de las técnicas de inteligencia artificial que proporciona herramientas que permiten computadoras para mejorar su análisis basado en eventos previos. Estos sistemas informáticos aprovechan los datos históricos de intentos anteriores para resolver una tarea con el fin de mejorar el rendimiento de intentos futuros en tareas similares. En términos de resultados esperados, el aprendizaje automático ...

Ejecutando aplicaciones antes de Hadoop 2 - dummies

Ejecutando aplicaciones antes de Hadoop 2 - dummies

Debido a que muchas implementaciones de Hadoop existentes todavía no están utilizando Yet Another Resource Negotiator ( YARN), eche un vistazo rápido a cómo Hadoop administró su procesamiento de datos antes de los días de Hadoop 2. Concéntrese en la función que los daemons maestros JobTracker y los daemons esclavos TaskTracker jugaron al manejar el procesamiento de MapReduce. El objetivo de emplear sistemas distribuidos ...

Riesgo Modelar con Hadoop - dummies

Riesgo Modelar con Hadoop - dummies

Modelar el riesgo es otro caso de uso importante que Hadoop energiza. Descubrirá que coincide estrechamente con el caso de uso de detección de fraude en el sentido de que se trata de una disciplina basada en modelos. Cuantos más datos tenga y más pueda "conectar los puntos", más a menudo sus resultados producirán mejores modelos de predicción de riesgos. La palabra que lo abarca todo ...