Hogar Finanzas personales Cómo plantear las estadísticas en ggplot2 en dummies

Cómo plantear las estadísticas en ggplot2 en dummies

Tabla de contenido:

Video: 9.4 Diagramas de caja 2025

Video: 9.4 Diagramas de caja 2025
Anonim

Después de los datos, el mapeo y los geoms, el cuarto elemento de una capa ggplot2 en R describe cómo se deben resumir los datos. En ggplot2, se refiere a este resumen estadístico como una estadística .

Una característica muy conveniente de ggplot2 es su rango de funciones para resumir sus datos en la trama. Esto significa que a menudo no tiene que resumir previamente sus datos. Por ejemplo, la altura de las barras en un histograma indica cuántas observaciones de algo tienes en tus datos. El resumen estadístico para esto es contar las observaciones. Los estadísticos se refieren a este proceso como binning, y la estadística predeterminada para geom_bar () es stat_bin ().

Análogamente a la forma en que cada geom tiene una estadística predeterminada asociada, cada estadística también tiene un geom predeterminado.

Entonces, esto plantea la pregunta: ¿cómo decides si usar un geom o una estadística? En teoría, no importa si primero eliges el geom o el stat. En la práctica, sin embargo, a menudo es intuitivo comenzar primero con un tipo de trama; en otras palabras, especificar un geom. Si luego quieres agregar otra capa de resumen estadístico, usa una estadística.

geom_bar (). "Width =" 535 ">

Haciendo un histograma con geom_bar ().

En este gráfico, utilizó los mismos datos para crear primero un diagrama de dispersión con geom_point (), y luego agregó una línea suave con stat_smooth ().

Aquí algunos ejemplos prácticos del uso de funciones estadísticas.

Stat Descripción Valor predeterminado Geom
stat_bin () Cuenta el número de observaciones en contenedores. geom_bar ()
stat_smooth () Crea una línea suave. geom_line ()
stat_sum () Agrega valores. geom_point ()
stat_identity () Sin resumen. Traza los datos como están. geom_point ()
stat_boxplot () Resume datos para un diagrama de caja y patillas. geom_boxplot ()
> Datos de Binning

Ya has visto cómo usar stat_bin () para resumir tus datos en contenedores, porque esta es la estadística predeterminada de geom_bar (). Esto significa que las siguientes dos líneas de código producen gráficas idénticas: >> ggplot (terremotos, aes (x = profundidad)) + geom_bar (binwidth = 50)> ggplot (terremotos, aes (x = profundidad)) + stat_bin (binwid th = 50)

Datos de suavizado

El paquete ggplot2 también hace que sea muy fácil crear líneas de regresión a través de sus datos. Utiliza la función stat_smooth () para crear este tipo de línea.

Lo interesante de stat_smooth () es que hace uso de la regresión local de forma predeterminada. R tiene varias funciones que pueden hacer esto, pero ggplot2 usa la función loess () para la regresión local. Esto significa que si desea crear un modelo de regresión lineal, debe decirle a stat_smooth () que use una función suavizante diferente.Usted hace esto con el argumento del método.

Para ilustrar el uso de un suavizador, comience por crear un diagrama de dispersión del desempleo en el conjunto de datos longley: >> p p

A continuación, agregue un suavizador. Esto es tan simple como agregar stat_smooth () a su línea de código. >> p + stat_smooth ()

Su gráfico debe verse como el diagrama a la izquierda de la imagen a continuación.

A veces, ggplot2 genera mensajes con consejos e información adicionales. Siempre que no vea advertencia o error, puede ignorar estos mensajes de forma segura. En este caso, stat_smooth () le dice que el suavizador predeterminado es un método llamado

loess

(suavizado local). El mensaje también dice que puede usar métodos alternativos de suavizado.

Finalmente, use stat_smooth () para ajustar y trazar un modelo de regresión lineal. Para ello, agregue el método de argumento = "lm": >> p + stat_smooth (method = "lm")

Su gráfico debe verse ahora como el gráfico de la derecha. stat_smooth (). "Width =" 535 "> Agregar líneas de regresión con stat_smooth ().

No hacer nada con la identidad

A veces no quiere que ggplot2 resuma sus datos en la trama. Esto generalmente ocurre cuando sus datos son ya pre-resumido o cuando cada línea de su marco de datos tiene que trazarse por separado. En estos casos, quiere decirle a ggplot2 que no haga nada en absoluto, y la estadística para hacer esto es stat_identity (). Probablemente haya notado que stat_identity es la estadística predeterminada para puntos y líneas.
Cómo plantear las estadísticas en ggplot2 en dummies

Selección del editor

Desenmascarando la máscara de subred para el examen CCNA - dummies

Desenmascarando la máscara de subred para el examen CCNA - dummies

Subredes le permite tomar prestados bits del host y usar ellos para permitir más redes. Al crear subredes, separar la red y el host requiere un mecanismo especial llamado máscara de subred. Una máscara de subred, que contiene un patrón de bits binarios de unos y ceros, se aplica a una dirección para extraer la ID de red para ...

Utilice su certificación CISSP para ser un agente de cambio - muñecos

Utilice su certificación CISSP para ser un agente de cambio - muñecos

Como un profesional de seguridad certificado, alguien con una credencial de Certified Information Systems Security Professional (CISSP), usted es un agente de cambio en su organización: el estado de las amenazas y las reglamentaciones cambia constantemente, y debe responder asegurando que el entorno y las políticas de su empleador continúen defendiendo los activos de su empleador contra daños. Estos son algunos de ...

Canales de comunicación de voz y CISSP - Dummies

Canales de comunicación de voz y CISSP - Dummies

El examen de certificación de Certified Information Systems Professional (CISSP) requiere conocimiento de principios de diseño seguro e implementación de diversas tecnologías de comunicación, incluida la voz. Los conmutadores PBX (Private Branch Exchange), POTS (Plain Old Telephone Systems) y VoIP (Voice over Internet Protocol) son algunos de los aspectos más olvidados y costosos de una infraestructura de telecomunicaciones corporativa. Muchos ...

Selección del editor

Cómo buscar en la red de LinkedIn para una persona específica: muñecos

Cómo buscar en la red de LinkedIn para una persona específica: muñecos

Cuando esté listo para encontrar a una persona específica, use el motor de búsqueda de LinkedIn, con el que puede escanear las decenas de millones de miembros de LinkedIn, en función de las palabras clave. Las dos formas principales de buscar en la red son una búsqueda básica y una Búsqueda avanzada. En la parte superior de cada página de LinkedIn hay un sencillo ...

Cómo enviar una solicitud de conexión de LinkedIn a un miembro no miembro: dummies

Cómo enviar una solicitud de conexión de LinkedIn a un miembro no miembro: dummies

Solo los miembros de LinkedIn pueden ser parte de la red de cualquier persona. Por lo tanto, si desea enviar una solicitud de conexión a alguien que aún no se ha unido a LinkedIn, primero debe invitar a esa persona a crear una cuenta de LinkedIn. Puede enviar un correo electrónico directamente a su invitado, pedirle que se una, o puede usar un ...

Cómo buscar empresas en LinkedIn - muñecos

Cómo buscar empresas en LinkedIn - muñecos

Cuando necesite saber más sobre su industria actual o encuentra un socio comercial potencial para un gran negocio, LinkedIn te brinda herramientas para investigar un poco. Las páginas de empresas de LinkedIn permiten a los usuarios explorar empresas de su interés y recibir actualizaciones de la empresa y noticias de la industria, así como investigar los productos y servicios de cada compañía ...

Selección del editor

Cómo eliminar registros con la característica Eliminar duplicados de Excel 2013 - Dummies

Cómo eliminar registros con la característica Eliminar duplicados de Excel 2013 - Dummies

Puede usar Excel's Eliminate Duplicates característica para encontrar y eliminar rápidamente registros duplicados de una lista (o filas de una tabla). Esta es una gran característica, especialmente cuando se trata de una gran lista de datos en la que varias personas diferentes realizan la entrada de datos y que no deberían tener ningún registro duplicado (como ...

Cómo editar títulos de gráfico en Excel 2016 - Dummies

Cómo editar títulos de gráfico en Excel 2016 - Dummies

Cuando Excel 2016 primero agrega títulos a un nuevo gráfico , les da nombres genéricos, como título de gráfico y título de eje (para los títulos de eje xey). Para reemplazar estos títulos genéricos con los títulos reales de los gráficos, haga clic en el título en el gráfico o haga clic en el nombre del título en el Gráfico ...

Cómo ingresar una fórmula usando nombres de celda en Excel 2013 - dummies

Cómo ingresar una fórmula usando nombres de celda en Excel 2013 - dummies

Nombres de celda son una excelente forma de entender el propósito de sus fórmulas en Excel 2013. Por ejemplo, suponga que tiene una fórmula simple en la celda K3 que calcula el total que le debe al multiplicar las horas que trabaja para un cliente (en la celda I3) por el tarifa por hora del cliente (en la celda ...