Video: Apache Drill Introduction 2025
Apache Drill es un proyecto candidato en la incubadora Apache. Apache Drill no es especialmente enfermizo, sin embargo. Todas las tecnologías candidatas de la Apache Software Foundation (ASF) comienzan como proyectos de incubadora antes de convertirse en tecnologías oficiales de ASF. Puedes leer sobre la Incubadora Apache. Puedes leer sobre Drill.
Inspirado en la tecnología Dremel de Google, el objetivo de rendimiento establecido para Drill es habilitar las consultas SQL frente a un petabyte o más de datos distribuidos en más de 10.000 servidores. La figura ilustra la arquitectura de Apache Drill.
Puede ver que la clave de la arquitectura de Drill son los servidores DrillBit implementados en cada nodo de datos. Tenga en cuenta que cada servidor incluye un analizador de consultas, compilador, optimizador y tiempo de ejecución, pero hay un servidor maestro DrillBit designado por los servidores Zookeeper, que supervisa la ejecución de las consultas y se ocupa de reunir los conjuntos de resultados provisionales en un único conjunto de salida.
Al igual que Dremel, Drill puede coexistir con, y complementar, MapReduce, pero MapReduce no se usa para completar consultas, como con Apache Hive. En cambio, los motores de ejecución llamados Drillbits han sido desarrollados por miembros de la comunidad Drill.
Esta comunidad tiene como objetivo proporcionar consultas de baja latencia para aplicaciones como paneles de inteligencia empresarial en tiempo real, detección de fraude y otros casos de uso urgentes. Drill admite tipos de datos anidados, como Avro, JSON y buffers de protocolo de Google. Estos tipos de datos anidados permiten tablas muy grandes desnormalizadas.
El equipo de desarrollo de Drill también está trabajando para proporcionar un amplio soporte de SQL apuntando al cumplimiento de SQL2003. Finalmente, tenga en cuenta que el equipo Drill brinda soporte HBase para que los usuarios puedan consultar tablas HBase con SQL.
