Tabla de contenido:
- Cómo obtener el resultado
- ¿Viste los valores raros para la variable cyl? Una mirada rápida al resumen puede indicar que hay algo sospechoso, ya que, por ejemplo, el mínimo y el primer cuartil tienen exactamente el mismo valor. De hecho, la variable cyl solo tiene tres valores y estaría mejor como factor. Entonces, pongamos esa variable fuera de su miseria: >> cars $ cyl <- as. factor (cars $ cyl)
Video: Como Agrupar (GroupBy) y resumir datos en R 2024
Si necesita una visión general rápida de su conjunto de datos, puede, por supuesto, usar siempre el comando R str () y mira la estructura. Pero esto te dice algo solo sobre las clases de tus variables y el número de observaciones. Además, la función head () le brinda, en el mejor de los casos, una idea de la forma en que se almacenan los datos en el conjunto de datos.
Cómo obtener el resultado
Para tener una mejor idea de la distribución de sus variables en el conjunto de datos, puede usar la función summary () como esta:
La función de resumen () funciona mejor si solo usa R interactivamente en la línea de comando para escanear su conjunto de datos rápidamente. No debe intentar usarlo dentro de una función personalizada que usted mismo haya escrito.
Variables numéricas:
-
summary () le da el rango, cuartiles, mediana y media. Variables de factor:
-
summary () le da una tabla con frecuencias. Variables numéricas y de factor:
-
summary () le proporciona la cantidad de valores perdidos, si los hay.
-
summary () no proporciona ninguna información aparte de la longitud y la clase (que es 'carácter'). Cómo solucionar un problema