Tabla de contenido:
- Cómo hacer cálculos aritméticos en columnas de una trama de datos
- La función con () le permite consultar columnas dentro de un marco de datos sin usar explícitamente el signo de dólar o incluso el nombre del marco de datos en sí. Entonces, en nuestro ejemplo, porque usas con (iris, …) R sabe para evaluar ambos Sepal. Longitud y Sepal. Ancho en el contexto de iris.
Video: 5.7 Cómo añadir filas y columnas a un data frame 2024
Después de haber creado el subconjunto apropiado de sus datos, es probable que el siguiente paso en su análisis sea realizar algunos cálculos con R.
Cómo hacer cálculos aritméticos en columnas de una trama de datos
R hace que sea muy fácil realizar cálculos en columnas de un marco de datos porque cada columna es ella misma un vector. Ajustándose al marco de datos del iris, intente hacer algunos cálculos en las columnas. Por ejemplo, calcule la relación entre las longitudes y el ancho de los sépalos:
Ahora puede usar todas las herramientas R para examinar su resultado. Por ejemplo, inspeccione los primeros cinco elementos de sus resultados con la función head (): >> head (x) [1] 1. 457143 1. 633333 1. 468750 1. 483871 1. 388889 1. 384615
Como puede ver, realizar cálculos en columnas de un marco de datos es sencillo. Solo tenga en cuenta que cada columna es realmente un vector, por lo que simplemente debe recordar cómo realizar operaciones en vectores.
Cómo usar con y dentro para mejorar la legibilidad del código
Después de un tiempo corto de escribir enunciados subconjuntos en R, se cansará de escribir el signo de dólar para extraer columnas de un marco de datos. Afortunadamente, hay una forma de reducir la cantidad de tipeo y hacer que tu código sea mucho más legible al mismo tiempo. El truco es usar la función con (). Pruebe esto: >> y <- con (iris, Longitud Sepal / Ancho Sepal.)La función con () le permite consultar columnas dentro de un marco de datos sin usar explícitamente el signo de dólar o incluso el nombre del marco de datos en sí. Entonces, en nuestro ejemplo, porque usas con (iris, …) R sabe para evaluar ambos Sepal. Longitud y Sepal. Ancho en el contexto de iris.
Con suerte, usted acepta que esto es mucho más fácil de leer y entender. Al imprimir los valores de su nueva variable y, puede confirmar que es idéntica a x en el ejemplo anterior. >> head (y) [1] 1. 457143 1. 633333 1. 468750 1. 483871 1. 388889 1. 384615
También puede usar la función idéntica () para que R le diga si estos valores son, de hecho, lo mismo:
Además de con (), la útil función dentro () le permite asignar valores a columnas en sus datos muy fácilmente. Supongamos que desea agregar su relación calculada de longitud del sépalo al ancho del marco de datos original. Ya está familiarizado con escribirlo así: >> iris $ ratio <- iris $ Sepal. Longitud / iris $ Sepal. Ancho
Ahora, usando dentro () se convierte en lo siguiente: