Hogar Finanzas personales Factores de formulario de despliegue alternativo para Hadoop - Dummies

Factores de formulario de despliegue alternativo para Hadoop - Dummies

Tabla de contenido:

Video: Technology Stacks - Computer Science for Business Leaders 2016 2025

Video: Technology Stacks - Computer Science for Business Leaders 2016 2025
Anonim

Aunque Hadoop funciona mejor cuando está instalado en una computadora física, donde el procesamiento tiene acceso directo a almacenamiento y redes dedicadas, Hadoop tiene implementaciones alternativas. Y aunque son menos eficientes que el hardware dedicado, en ciertos casos las alternativas son opciones que valen la pena.

Servidores virtualizados

Una tendencia importante en los centros de TI durante la última década es la virtualización, donde un servidor grande puede alojar varias "máquinas virtuales" que se ven y actúan como máquinas únicas. En lugar de hardware dedicado, el conjunto completo de aplicaciones y repositorios de una organización se implementa en hardware virtualizado.

Este enfoque tiene muchas ventajas: la centralización de TI simplifica el mantenimiento, la inversión en TI se maximiza debido a la menor cantidad de ciclos de CPU no utilizados y la huella total del hardware es menor, lo que resulta en un menor costo total de propiedad.

Las organizaciones en las que las implementaciones de TI están completamente virtualizadas a veces requieren que cada nueva aplicación siga este modelo. Aunque Hadoop se puede implementar de esta manera, esencialmente como un clúster virtual (con nodos maestros virtuales y nodos virtuales esclavos), el rendimiento se resiente, en parte porque en la mayoría de los entornos virtualizados, el almacenamiento está basado en SAN y no está conectado localmente.

Debido a que Hadoop está diseñado para funcionar mejor cuando todos los núcleos de CPU disponibles pueden tener acceso rápido a discos independientes, se crea un cuello de botella ya que todas las tareas de mapa y reducción comienzan a procesar datos a través de la red limitada entre las CPU y la SAN. Dado que el grado de aislamiento entre los recursos del servidor virtualizado es limitado (los servidores virtuales comparten recursos entre sí), las cargas de trabajo de Hadoop también pueden verse afectadas por otra actividad.

Cuando el rendimiento de su servidor virtual se ve afectado por la carga de trabajo de otro servidor, eso es realmente conocido en los círculos de TI como un problema de "vecino ruidoso".

Los entornos virtualizados pueden ser muy útiles, sin embargo, en algunos casos. Por ejemplo, si su organización necesita completar un análisis exploratorio único de un conjunto de datos grande, puede crear fácilmente un clúster temporal en su entorno virtualizado. Este método a menudo es una forma más rápida de obtener la aprobación interna que soportar las complicaciones burocráticas de adquirir nuevo hardware dedicado.

A medida que experimentas con Hadoop, a menudo lo ejecutas en tus máquinas portátiles a través de una máquina virtual (VM). Hadoop es extremadamente lento en este tipo de entorno, pero si usa conjuntos pequeños de datos, es una valiosa herramienta de aprendizaje y prueba.

Implementaciones en la nube

Las variaciones de entornos virtualizados son proveedores de computación en la nube como Amazon, Rackspace e IBM SoftLayer. La mayoría de los principales proveedores de nube pública ahora tienen ofertas de MapReduce o Hadoop disponibles para su uso. Una vez más, su rendimiento es inferior al despliegue de su clúster en hardware dedicado, pero está mejorando.

Los proveedores de la nube están haciendo que los entornos Hadoop optimizados estén disponibles donde los nodos esclavos tienen un almacenamiento conectado localmente y una red dedicada. Además, los hipervisores son cada vez más eficientes, con una sobrecarga y una latencia reducidas.

No considere una solución en la nube para aplicaciones a largo plazo, porque el costo de alquilar recursos de computación en la nube es significativamente más alto que el de poseer y mantener un sistema comparable. Con un proveedor de la nube, está pagando por la comodidad y por poder descargar la sobrecarga del hardware de aprovisionamiento. Sin embargo, la nube es una plataforma ideal para pruebas, educación y tareas de procesamiento de datos de una sola vez.

Además de las consideraciones de rendimiento y costo, tiene consideraciones reglamentarias con las implementaciones de nubes públicas. Si tiene datos confidenciales, que deben almacenarse internamente o en el país, una implementación en la nube pública no es una opción. En casos como este, donde necesita la comodidad de una implementación basada en la nube, una nube privada es una buena opción, si está disponible.

Factores de formulario de despliegue alternativo para Hadoop - Dummies

Selección del editor

Entrada de datos por exceso de velocidad con la función de Autocompletar de Excel 2007 - imitaciones

Entrada de datos por exceso de velocidad con la función de Autocompletar de Excel 2007 - imitaciones

Use la función Autocompletar en Microsoft Office Excel 2007 para crea rápidamente una serie de entradas basadas en los datos que ingresas en una o dos celdas. El auto relleno de Excel 2007 funciona con días de la semana, meses del año y trimestres anuales. Si desea usar Autocompletar para una serie de números, ingrese ...

Tablas inteligentes que se expanden con datos en modelos de datos de Excel: dummies

Tablas inteligentes que se expanden con datos en modelos de datos de Excel: dummies

Uno de los desafíos que puede El encuentro al construir modelos de datos en Excel es una tabla de datos que se expande con el tiempo. Es decir, la tabla crece en la cantidad de registros que posee debido a la adición de nuevos datos. Para obtener una comprensión básica de este desafío, eche un vistazo a lo siguiente ...

Dividir datos en múltiples columnas en Excel 2007 - dummies

Dividir datos en múltiples columnas en Excel 2007 - dummies

Usar el Asistente para Convertir texto en columnas en Excel 2007 cuando necesita dividir los datos combinados en columnas separadas, como un nombre y apellido; o ciudad, estado y código postal. Este tipo de datos combinados a menudo se produce cuando abre o importa archivos creados en otra aplicación.

Selección del editor

Cómo copiar el formato de Excel 2010 con el formato Painter - Dummies

Cómo copiar el formato de Excel 2010 con el formato Painter - Dummies

Use el botón Format Painter en el Inicio pestaña de Excel 2010 Ribbon para ahorrar tiempo al copiar el formato entre celdas en sus hojas de trabajo. También puede usar Copiar formato para copiar rápidamente el ancho de una columna a otra columna. Simplemente seleccione el encabezado de la primera columna, haga clic en el botón Copiar formato, ...

Cómo copiar estilos personalizados en Excel 2013 - dummies

Cómo copiar estilos personalizados en Excel 2013 - dummies

Excel 2013 hace que sea fácil copiar estilos de celda personalizados que ha guardado como parte de un libro de trabajo en el libro en el que está trabajando actualmente. Para copiar estilos personalizados de un libro de trabajo a otro, siga estos pasos:

Cómo copiar fórmulas de Excel con la manija de relleno - muñecos

Cómo copiar fórmulas de Excel con la manija de relleno - muñecos

Te encantará el identificador de relleno en Excel El controlador de relleno es una manera rápida de copiar el contenido de una celda a otras celdas con un solo clic y arrastrar. La celda activa siempre tiene una pequeña caja cuadrada en el lado inferior derecho de su borde. Esa es la manija de relleno. Cuando ...

Selección del editor

Cómo imprimir a escala desde Google SketchUp 8 - Dummies

Cómo imprimir a escala desde Google SketchUp 8 - Dummies

A veces, en lugar de imprimir exactamente lo que ver en su pantalla de Google SketchUp para que quepa en una hoja de papel, puede necesitar imprimir un dibujo a escala. Los pasos a continuación le muestran cómo producir una impresión a escala de SketchUp. Cuando los elementos de la interfaz de usuario son diferentes para las dos plataformas, el ...

Cómo quitar bordes antiestéticos de su modelo de SketchUp - dummies

Cómo quitar bordes antiestéticos de su modelo de SketchUp - dummies

Si se está preguntando cómo obtener Deshazte de todas las líneas feas que aparecen cuando usas Sígueme, la respuesta es bastante simple: puedes suavizar los bordes, al igual que puedes ocultarlos. La diferencia entre ocultar y suavizar se ilustra con las imágenes de los cilindros en la figura que sigue: Cuando ...

Cómo desglosar un sitio en SketchUp - dummies

Cómo desglosar un sitio en SketchUp - dummies

Quizás desee modelar un trozo pequeño de nonflat terreno que rodea un modelo de construcción en SketchUp. Tal vez estés tratando de reproducir las condiciones existentes del sitio, o tal vez estés en el proceso de diseñar el paisaje para un proyecto. Hay una técnica clara para casos como este: puede usar From Contours para hacer rápidamente ...