Video: MOOC BigData: Almacenamiento y Gestión de Datos 2024
¿El Big Data es realmente nuevo o es una evolución en el camino de la administración de datos? En realidad son ambos. Al igual que con otras olas en la gestión de datos, Big Data se basa en la evolución de las prácticas de gestión de datos en las últimas cinco décadas. Lo nuevo es que, por primera vez, el costo de los ciclos informáticos y el almacenamiento han alcanzado un punto de inflexión. ¿Porque es esto importante?
Hace solo unos pocos años, las organizaciones generalmente comprometían el almacenamiento de instantáneas o subconjuntos de información importante porque el costo de almacenamiento y las limitaciones de procesamiento les prohibía almacenar todo lo que deseaban analizar.
En muchas situaciones, este compromiso funcionó bien. Por ejemplo, una empresa de fabricación podría haber recopilado datos de la máquina cada dos minutos para determinar el estado de los sistemas. Sin embargo, podría haber situaciones en las que la instantánea no contenga información sobre un nuevo tipo de defecto y que pueda pasar desapercibida durante meses.
Con big data, ahora es posible virtualizar los datos para que puedan ser almacenados de manera eficiente y, utilizando el almacenamiento basado en la nube, también de forma más rentable. Además, las mejoras en la velocidad y confiabilidad de la red han eliminado otras limitaciones físicas de poder administrar grandes cantidades de datos a un ritmo aceptable.
Agregue a esto el impacto de los cambios en el precio y la sofisticación de la memoria de la computadora. Con todas estas transiciones de tecnología, ahora es posible imaginar formas en que las empresas pueden aprovechar datos que hubieran sido inconcebibles hace tan solo cinco años.
Pero ninguna transición tecnológica ocurre aisladamente; sucede cuando existe una necesidad importante que puede satisfacerse mediante la disponibilidad y la maduración de la tecnología. Muchas de las tecnologías en el corazón de los macrodatos, como la virtualización, el procesamiento paralelo, los sistemas de archivos distribuidos y las bases de datos en memoria, existen desde hace décadas.
Los análisis avanzados también han existido durante décadas, aunque no siempre han sido prácticos. Otras tecnologías como Hadoop y MapReduce han estado en la escena por solo unos pocos años. Esta combinación de avances tecnológicos ahora puede abordar problemas comerciales importantes. Las empresas desean obtener información valiosa y resultados procesables de muchos tipos diferentes de datos a la velocidad adecuada.
Si las empresas pueden analizar petabytes de datos (equivalentes a 20 millones de archivadores de cuatro cajones llenos de archivos de texto o 13. 3 años de contenido HDTV) con un rendimiento aceptable para discernir patrones y anomalías, las empresas pueden comenzar a dar sentido a los datos de nuevas maneras.El cambio a Big Data no se trata solo de negocios.
Las actividades de ciencia, investigación y gobierno también han ayudado a impulsarlo. Solo piense en analizar el genoma humano o en tratar con todos los datos astronómicos recopilados en los observatorios para avanzar en nuestra comprensión del mundo que nos rodea. Tenga en cuenta la cantidad de datos que el gobierno recaba en sus actividades antiterroristas también, y se da cuenta de que el big data no es solo de negocios.
Existen diferentes enfoques para manejar datos. Los datos en movimiento se utilizarían si una empresa puede analizar la calidad de sus productos durante el proceso de fabricación para evitar errores costosos. Los datos en reposo serían utilizados por un analista de negocios para comprender mejor los patrones de compra actuales de los clientes en función de todos los aspectos de la relación con el cliente, incluidas las ventas, los datos de las redes sociales y las interacciones con el servicio al cliente.
Tenga en cuenta que las empresas aún se encuentran en una etapa inicial de aprovechar grandes volúmenes de datos para obtener una visión de 360 grados del negocio y anticipar cambios y cambios en las expectativas de los clientes. Las tecnologías requeridas para obtener las respuestas que las necesidades del negocio aún están aisladas entre sí.
Big data no se trata simplemente de una herramienta o una tecnología. Se trata de cómo todas estas tecnologías se unen para proporcionar las ideas correctas, en el momento adecuado, basadas en los datos correctos, ya sea generados por personas, máquinas o la web.