Hogar Finanzas personales Gráfico Procesamiento En Hadoop - dummies

Gráfico Procesamiento En Hadoop - dummies

Tabla de contenido:

Video: Hadoop Processing Frameworks 2024

Video: Hadoop Processing Frameworks 2024
Anonim

Una de las tecnologías NoSQL emergentes más interesantes implica el almacenamiento y procesamiento de datos de gráficos. Puede pensar que esta afirmación es una noticia antigua porque los científicos en computación han estado desarrollando técnicas de análisis de gráficos durante décadas. Lo que dices puede ser cierto, pero lo nuevo es que al usar Hadoop, puedes hacer un análisis de gráficos a gran escala.

¿Qué es la información gráfica?

Un gráfico en términos de datos es simplemente una representación de entidades individuales y sus relaciones. Las entidades de un gráfico se conocen como nodos (o vértices ), y las relaciones entre entidades en un gráfico se conocen como bordes (o conexiones >). Representar conjuntos de datos en un gráfico, a diferencia de las filas y columnas tradicionales, hace que sea mucho más fácil procesar sus datos de forma que las relaciones entre los objetos sean claras. Los cálculos de gráficos típicos están representados por la distancia de ruta más corta entre múltiples nodos en su gráfica, o simplemente por cuántos nodos tienen conexiones de cierto tipo con un nodo específico.

Aplicaciones para análisis de gráficos

La aplicación más conocida para bases de datos de gráficos es el algoritmo PageRank de Google, que calcula las relaciones de enlace entre todas las páginas web conocidas. Google representa la web como un gráfico gigante, donde las páginas web son nodos y los enlaces de una página a otra se representan como bordes. (Google compartió la riqueza al publicar un documento que describe su proyecto de análisis de gráficos, etiquetado Pregel, en 2010.) El procesamiento de gráficos que interesaba a Google incluía el cálculo de la cantidad de conexiones entrantes para cada página web.

Facebook tuvo un gran impacto en 2013 cuando anunció que utilizaba Apache Giraph (basado en el documento de Pregel), un motor de procesamiento de gráficos diseñado para procesar gráficos almacenados en HDFS. Mostró el poder de Giraph al mostrar un gráfico que representa a todos los usuarios de Facebook (más de 1 mil millones) y sus amistades (¡miles de millones!), Que en total tiene más de 1 billón de bordes. Esta escala es asombrosa: si eres Facebook y necesitas hacer cálculos como recomendaciones de amigos, ¿qué mejor herramienta usar que un motor de procesamiento de gráficos? No es de extrañar que una base de datos de gráficos distribuidos se encuentre en el núcleo de cualquier otro sitio de redes sociales notable, incluidos Twitter, LinkedIn, OkCupid y Pinterest.

Un motor de procesamiento de gráficos puede responder fácilmente a muchas preguntas prácticas para sitios de redes sociales. Dos ejemplos son cómo LinkedIn muestra los grados de separación entre usted y otro usuario: el cálculo de ruta más corto (¿cuál es la conexión más cercana entre dos nodos?) y cómo OkCupid muestra a los usuarios con intereses comunes un conjunto de cálculos de filtrado colaborativo (¿cuáles son las conexiones más comunes a un conjunto específico de nodos?).

Análisis de gráficos en Hadoop

A partir de la primavera de 2014, el análisis de gráficos en Hadoop permanece en sus etapas iniciales. Con la llegada de YARN en Hadoop 2, el análisis de gráficos y otras técnicas de procesamiento especializadas serán cada vez más populares en Hadoop. Muchos de los sitios sociales mencionados en este artículo usan sus propias bases de datos de gráficos patentados y motores de procesamiento, pero Facebook es un usuario prominente de Giraph. Debido al sello de aprobación (implícito) de Facebook, Giraph se ha convertido en una opción popular para el análisis de gráficos en Hadoop, pero tiene algunas limitaciones. Es únicamente un motor de procesamiento porque carga datos como un gráfico en la memoria del clúster, y está optimizado para consultas orientadas a lotes.

Otra solución de procesamiento de gráficos proviene de Aurelius, una compañía que ha lanzado un conjunto de herramientas de análisis de gráficos de código abierto para Hadoop. En el centro de sus ofertas está Titan, una base de datos de gráficos que usa HBase como capa de persistencia optimizada para consultas interactivas, y Faunus, un motor de procesamiento de gráficos que almacena una instantánea de un gráfico de Titán en HDFS y ejecuta trabajos de MapReduce en su contra.. Tanto para las aplicaciones interactivas (Titán) como para las aplicaciones por lotes (Faunus), Aurelius tiene la API de cruce de gráficos común llamada Gremlin.

Finalmente, el proyecto Apache Spark tiene la rama GraphX, que permite la generación de datos de gráficos y luego el procesamiento, todo dentro del marco de Spark.

Gráfico Procesamiento En Hadoop - dummies

Selección del editor

Cómo escuchar el código Morse en Ham Radio - Dummies

Cómo escuchar el código Morse en Ham Radio - Dummies

En la radioafición, las señales del código Morse son a menudo denominado CW, que significa onda continua. Las primeras señales de radio se extinguieron rápidamente porque fueron generadas por chispas. Pronto, sin embargo, los operadores descubrieron cómo hacer señales estables u ondas continuas, al encender y apagar las señales con una tecla de telégrafo. Por lo tanto, el código Morse ...

Cómo elegir una computadora para su Ham Radio Shack - Dummies

Cómo elegir una computadora para su Ham Radio Shack - Dummies

Una computadora puede estar involucrada en casi todas las actividades. La radio Ham ha adoptado las computadoras más íntimamente que la mayoría de los pasatiempos. Originalmente utilizada como reemplazo del libro de registro en papel, la computadora en la radioafición ha evolucionado casi hasta el punto de convertirse en una segunda operación, controlando radios, enviando y recibiendo CW, y vinculando su chabola a ...

Cómo encontrar recursos de estudio para Ham Radio Licensure - Dummies

Cómo encontrar recursos de estudio para Ham Radio Licensure - Dummies

Si está listo para comenzar a estudiar , ¿que estudias? Afortunadamente para ti, el aspirante a operador de radioaficionados, hay numerosas referencias de estudio disponibles para todos los gustos y capacidades. Los materiales de estudio comunes incluyen clases, libros, software, videos y ayuda en línea. Antes de comprar cualquier material de estudio, tenga en cuenta que las preguntas y normas de la prueba cambian una vez ...

Selección del editor

Obteniendo un GED para candidatos de inglés como segundo idioma: dummies

Obteniendo un GED para candidatos de inglés como segundo idioma: dummies

Si su primer idioma es Francés o español, puede obtener mejores resultados en la prueba de GED llevándola, o al menos algunas secciones de la misma, en su idioma nativo. La prueba de GED está disponible en inglés, español y francés. Sin embargo, las opciones de idioma varían en todo Estados Unidos. Solo algunos estados permiten que los estudiantes combinen ...

10 Consejos para resolver problemas de razonamiento matemático de GED y verificar tus respuestas - tontos

10 Consejos para resolver problemas de razonamiento matemático de GED y verificar tus respuestas - tontos

Cuando Si está tomando el examen de Razonamiento Matemático de GED (o cualquiera de los exámenes de GED para el caso), tiene que luchar contra el reloj. Los siguientes son diez consejos útiles para ahorrar tiempo y asegurarse de que las respuestas a las que llega sean las correctas. Hazte real: trata de desarrollar un sexto sentido sobre el mundo real ...

10 Errores de escritura difíciles de evitar para el GED RLA - Dummies

10 Errores de escritura difíciles de evitar para el GED RLA - Dummies

Incluso los escritores más talentosos cometer errores sin darse cuenta de que están rompiendo las reglas. Antes de tomar el examen de GED Reasoning Through Language Arts, revise estos diez errores comunes de escritura que los examinadores cometen al escribir la Respuesta Extendida para que sepa cuáles son las reglas y cómo mantenerse al margen de estas trampas comunes. Mal uso de palabras ...

Selección del editor

Spotify Buscar Firefox y Spotify Super Search - dummies

Spotify Buscar Firefox y Spotify Super Search - dummies

La búsqueda de Spotify para Firefox, una ingeniosa y pequeño complemento muy popular, le permite resaltar el texto del sitio web (como el título del álbum o el artista), haga clic con el botón derecho (o Ctrl-clic en una Mac) y luego seleccione Spotify Search en el menú que parece abrir un lista de opciones de búsqueda. Puede elegir entre hacer ...

Growl para Mac de spotify - dummies

Growl para Mac de spotify - dummies

Los usuarios de Mac que escuchan música a través de Spotify normalmente no pueden decir cuál es el título o Artista es a menos que ya lo sepan o entren en el programa Spotify para ver qué se está reproduciendo, lo que puede ser una molestia si estás ocupado trabajando en otra cosa. El esfuerzo extra involucrado difiere enormemente de Windows 7, ...

Spotify Premium - Dummies

Spotify Premium - Dummies

Hay mucho más en Spotify Premium que en los lanzamientos exclusivos, aunque los suscriptores Premium sí tienen la oportunidad de escuchar a lanzamientos antes de otros suscriptores. Obtiene todos los beneficios de una suscripción ilimitada, sin publicidad, sin restricciones de tiempo y acceso internacional, además de muchas características especiales. Cuando Lady Gaga lanzó su éxito de taquilla ...