Hogar Finanzas personales Cómo visualizar el análisis predictivo' Datos brutos '- dummies

Cómo visualizar el análisis predictivo' Datos brutos '- dummies

Tabla de contenido:

Video: Introducción a Data Science Experience (DSX) 2024

Video: Introducción a Data Science Experience (DSX) 2024
Anonim

Una imagen vale más que mil palabras, especialmente cuando intenta obtener un buen manejo de sus datos de análisis predictivo. En el paso de procesamiento previo, mientras prepara sus datos, es una práctica común visualizar lo que tiene a mano antes de continuar con el siguiente paso.

Empieza utilizando una hoja de cálculo como Microsoft Excel para crear una matriz de datos, que consiste en datos candidatos características (también conocidos como atributos ). Varios paquetes de software de inteligencia empresarial (como Tableau) pueden proporcionarle una descripción preliminar de los datos a los que está a punto de aplicar los análisis.

Cómo usar las visualizaciones tabulares para el análisis predictivo

Las tablas son la representación pictórica más sencilla y básica de los datos. Las tablas (también conocidas como hojas de cálculo ) consisten en filas y columnas, que corresponden, respectivamente, a los objetos y sus atributos mencionados anteriormente como la creación de sus datos. Por ejemplo, considere los datos de redes sociales en línea. Un objeto de datos podría representar a un usuario. Los atributos de un usuario (objeto de datos) pueden ser los encabezados de las columnas: género, código postal o fecha de nacimiento.

Las celdas en una tabla representan valores. La visualización en tablas puede ayudarlo a detectar fácilmente los valores de atributo perdidos de los objetos de datos.

Las tablas también pueden proporcionar la flexibilidad de agregar nuevos atributos que son combinaciones de otros atributos. Por ejemplo, en los datos de las redes sociales, puede agregar otra columna llamada Edad, que se puede calcular fácilmente como un atributo derivado del atributo Fecha de nacimiento existente. Los datos de la red social tabular muestran una nueva columna, Edad, creada a partir de otra columna existente (Fecha de nacimiento).

Uso de gráficos de barras en el análisis predictivo

Los gráficos de barras se pueden usar para detectar picos o anomalías en sus datos. Puede usarlo para cada atributo para representar rápidamente los valores mínimos y máximos. Los gráficos de barras también se pueden usar para iniciar una discusión sobre cómo normalizar sus datos.

La normalización es el ajuste de algunos o todos los valores de atributos en una escala que hace que los datos sean más utilizables. Por ejemplo, puede ver fácilmente que hay un error en los datos: la barra Age en un registro es negativa. Esa anomalía se representa más fácilmente por un gráfico de barras que por una tabla de datos.

Fundamentos de los gráficos circulares para el análisis predictivo

Los gráficos circulares se usan principalmente para mostrar los porcentajes. Pueden ilustrar fácilmente la distribución de varios elementos y resaltar los más dominantes. Los datos brutos de la red social se representan de acuerdo con el atributo Edad.Observe que el gráfico muestra no solo una distribución clara de hombres frente a mujeres, sino también un error probable: R como un valor para el tipo de género posiblemente creado cuando se recopilaron los datos.

Cómo usar gráficas de gráficos para el análisis predictivo

La teoría de gráficas proporciona un conjunto de algoritmos potentes que pueden analizar datos estructurados y representados como un gráfico. En informática, un gráfico es una estructura de datos, una forma de organizar datos que representa las relaciones entre pares de objetos de datos. Un gráfico consta de dos partes principales:

  • Vértices, también conocidos como nodos

  • Bordes, que conectan pares de nodos

Los bordes se pueden dirigir (dibujar como flechas) y pueden tener pesos. Puede decidir colocar un borde (flecha) entre dos nodos (círculos); en este caso, los miembros de la red social que están conectados a otros miembros como amigos:

La dirección de la flecha indica quiénes son los "amigos" que primero, o quien inicia interacciones la mayor parte del tiempo.

Conceptos básicos de nubes de palabras para análisis predictivo

Considere una lista de palabras o conceptos organizados como nube de palabras - una representación gráfica de todas las palabras en la lista, mostrando el tamaño de cada palabra como proporcional a una métrica que especifique. Por ejemplo, si tiene una hoja de cálculo de palabras y ocurrencias y desea identificar las palabras más importantes, intente con una nube de palabras.

Las nubes de palabras funcionan porque la mayoría de los datos de las organizaciones son texto; un ejemplo común es el uso de términos trending por parte de Twitter. Cada término en esta representación tiene un peso que afecta su tamaño como indicador de su importancia relativa.

Una forma de definir ese peso podría ser la cantidad de veces que aparezca una palabra en su colección de datos. Cuanto más frecuentemente aparece una palabra, más "pesado" es su peso, y cuanto más grande aparece en la nube.

Cómo utilizar la representación de aves en bandada para el análisis predictivo

El comportamiento de bandadas naturales en general es un sistema autoorganizado en el que los objetos (en particular, los seres vivos) tienden a comportarse de acuerdo con (a) el entorno al que pertenecen y (b) sus respuestas a otros objetos existentes. El comportamiento de congregación de sociedades naturales como las abejas, las moscas, las aves, los peces y las hormigas (o, para el caso, las personas) también se conoce como inteligencia de enjambre .

Las aves siguen reglas naturales cuando se comportan como una bandada. Compañeros de bandada son aves localizadas a cierta distancia una de la otra; esas aves se consideran similares. Cada pájaro se mueve de acuerdo con las tres reglas principales que organizan el comportamiento de flocado.

  • Separación: Los compañeros de bandada no deben colisionar entre ellos.

  • Alineación: Compañeros de bandada para moverse en la misma dirección promedio que sus vecinos.

  • Cohesión: Los compañeros de bandada se mueven de acuerdo con la posición o ubicación promedio de sus compañeros de bandada.

Modelar esas tres reglas puede permitir que un sistema analítico simule comportamientos de flocado. Utilizando el comportamiento natural autoorganizado de las aves en bandada, puede convertir una hoja de cálculo sencilla en una visualización.La clave es definir la noción de similitud como parte de sus datos. Comience con un par de preguntas:

  • ¿Qué hace que dos objetos de datos en sus datos sean similares?

  • ¿Qué atributos pueden conducir mejor a la similitud entre dos registros de datos?

Por ejemplo, en los datos de redes sociales, los registros de datos representan usuarios individuales; los atributos que los describen pueden incluir edad, código postal, estado de relación, lista de amigos, número de amigos, hábitos, eventos

Cómo visualizar el análisis predictivo' Datos brutos '- dummies

Selección del editor

Cómo usar el comando ARRAYRECT en AutoCAD 2014 - dummies

Cómo usar el comando ARRAYRECT en AutoCAD 2014 - dummies

Las cosas solían ser tan sencillas , oh, AutoCAD 2011. ARray fue inequívocamente un comando modificador, al igual que COpy o ROtate. Completaste los valores en un cuadro de diálogo y, después de un poco de ajuste, terminaste con varias copias de los objetos de origen, ordenadamente ordenados en patrones geométricos: en espaciado uniforme ...

Cómo configurar sus unidades de dibujo en AutoCAD 2014 - variables ficticias

Cómo configurar sus unidades de dibujo en AutoCAD 2014 - variables ficticias

Después de decidir sobre la escala y la hoja del dibujo tamaño, ya está listo para configurar su dibujo en AutoCAD 2014. Siga estos pasos para configurar las unidades lineales y angulares que desea usar en su nuevo dibujo: Haga clic en el botón Aplicación y luego seleccione Unidades del grupo Utilidades de dibujo. El cuadro de diálogo Unidades de dibujo ...

Cómo usar restricciones dimensionales en AutoCAD 2014 - dummies

Cómo usar restricciones dimensionales en AutoCAD 2014 - dummies

Los objetos que agrega a un dibujo de la dimensión el panel en AutoCAD no es lo mismo que los objetos de dimensión que agrega desde la pestaña Anotar. Las restricciones dimensionales son dimensiones impulsoras: cuando cambia el valor de una de estas dimensiones, la geometría cambia. Mucho sucede detrás de escena mientras aplica ...

Selección del editor

Cómo prepararse para la respuesta extendida de GED RLA - dummies

Cómo prepararse para la respuesta extendida de GED RLA - dummies

El ensayo de respuesta extendida sobre el GED El examen de Reasoning Through Language Arts requiere algunas habilidades muy específicas, que van desde la gramática y el uso adecuado del lenguaje hasta las habilidades de comprensión y análisis. Si alguna vez tuvo una discusión sobre quién tiene el mejor equipo o qué empleador es mejor, ya sabe cómo evaluar los argumentos y responder. ...

Cómo encontrar premisas y suposiciones para el GED RLA - dummies

Cómo encontrar premisas y suposiciones para el GED RLA - dummies

El razonamiento GED a través del lenguaje La prueba de arte incluirá preguntas que le piden que encuentre premisas y suposiciones en argumentos. Los argumentos contienen una o más premisas en las que se basa el argumento, y usted necesita poder distinguir las dos: Una premisa es una afirmación, que se presume que es verdadera, en ...

Cómo interpretar las variaciones en el significado y el tono para el GED RLA - Dummies

Cómo interpretar las variaciones en el significado y el tono para el GED RLA - Dummies

Capaz de interpretar las variaciones en el significado y el tono es parte de hacerlo bien en la prueba de GED Reasoning Through Language Arts. Usando un diccionario de sinónimos, puedes buscar la mayoría de las palabras y encontrar palabras con significados similares. Sin embargo, estas palabras similares típicamente difieren en cierto grado en el significado y el tono. Por ejemplo, "temeroso" y "cobarde" ...

Selección del editor

Personalizar su espacio de trabajo en WordPerfect Office 2002 - dummies

Personalizar su espacio de trabajo en WordPerfect Office 2002 - dummies

Puede controlar muchas cosas sobre la interfaz de WordPerfect (una fantasía término de cómo se ve y se comporta el programa). Podría pasar horas revisando todas las opciones, pero debe tener mejores cosas que hacer. A continuación se encuentran las opciones para las tareas que la mayoría de las personas es probable que aborden en WordPerfect. Sede de opciones: Configuración ...

Trabajando con plantillas en WordPerfect 12 - dummies

Trabajando con plantillas en WordPerfect 12 - dummies

Las plantillas son prototipos para diferentes tipos de documentos. Las plantillas son como formularios en blanco. Sin embargo, no necesariamente contienen texto. Una plantilla puede contener solo una colección de fuentes y estilos de formato específicos para un tipo particular de documento, o puede contener todo el texto de, por ejemplo, su contrato repetitivo. Siempre que ...

Trabajando con Graphics en WordPerfect 11 - Dummies

Trabajando con Graphics en WordPerfect 11 - Dummies

Algunos conceptos básicos antes de saltar al uso de gráficos: todas las imágenes viven en cajas. Todos los cuadros tienen bordes y fondos. Puede seleccionar cuadros y las imágenes que están en ellos de dos maneras. Si está escribiendo a lo largo de su texto y hace clic en un cuadro, obtiene manejadores negros y sin borde alrededor de ...