Video: Big Data SQL Support in Apache Apex / Hadoop 2025
Para ayudarlo a comenzar con Hadoop, aquí encontrará instrucciones sobre cómo descargar y configurar Hadoop rápidamente en su propia computadora portátil.. Su clúster se ejecutará en modo pseudo-distribuido en una máquina virtual, por lo que no necesitará hardware especial.
Una máquina virtual (VM) es una computadora simulada que puede ejecutar en una computadora real. Por ejemplo, puede ejecutar un programa en su computadora portátil que "reproduce" una VM, que abre una ventana que parece que está ejecutando otra computadora. En efecto, se está ejecutando una computadora simulada dentro de su computadora real.
Vas a descargar una VM, y mientras la ejecutas, instalarás Hadoop.
Apache Bigtop es una excelente alternativa si desea ensamblar sus propios componentes de Hadoop. Bigtop reúne los componentes centrales de Hadoop y garantiza que su configuración funcione. Apache Bigtop es una distribución de fuente 100% abierta.
El objetivo principal de Bigtop, en sí mismo un proyecto de Apache, al igual que Hadoop, es construir una comunidad en torno al empaquetado, la implementación y la integración de proyectos en el ecosistema de Apache Hadoop. El foco está en el sistema como un todo y no en proyectos individuales.
Al usar Bigtop, puede instalar e implementar fácilmente componentes de Hadoop sin tener que rastrearlos en una distribución específica y compararlos con una versión específica de Hadoop. A medida que se lanzan nuevas versiones de los componentes de Hadoop, a veces no funcionan con las versiones más recientes de otros proyectos. Si está solo, se requieren pruebas significativas.
Con Bigtop (o una versión comercial de Hadoop) puede confiar en que los expertos de Hadoop han hecho esta prueba por usted. Para darle una idea de cuán expansivo ha llegado Bigtop, consulte la siguiente lista de todos los componentes incluidos en Bigtop:
-
Apache Crunch
-
Apache Flume
-
Apache Giraph
-
Apache HBase
-
Apache HCatalog
-
Apache Hive
-
Apache Mahout
-
Apache Oozie
-
Apache Cerdo
-
Apache Solr
-
Apache Sqoop
-
Apache Whirr
-
Apache Zookeeper
-
Cloudera Hue
-
LinkedIn DataFu
Esta colección de proyectos del ecosistema Hadoop es tan extensa como se puede, ya que ambos proyectos mayores y menores están incluidos. Apache Bigtop está en constante evolución.
