Video: 7- CÓMO TRATAR [DATOS FALTANTES] en CSV CON RSTUDIO 2024
La función cor () en R puede tratar los valores de datos faltantes de múltiples maneras. Para eso, estableces el uso del argumento en uno de los posibles valores de texto. El valor del argumento de uso es especialmente importante si calcula las correlaciones de las variables en un marco de datos. Al establecer este argumento en diferentes valores, puede
-
Usar todas las observaciones configurando use = 'everything' . Esto significa que si hay un valor NA en una de las variables, la correlación resultante también es NA. Este es el predeterminado.
-
Excluir todas las observaciones que tienen NA para al menos una variable. Para esto, estableces use = 'completo. obs '. Tenga en cuenta que esto puede dejarle solo algunas observaciones si los valores faltantes se propagan a través del conjunto de datos completo.
-
Excluya las observaciones con valores de NA por cada par de variables que examine. Para eso, estableces el argumento use = 'pairwise'. Esto garantiza que pueda calcular la correlación para cada par de variables sin perder información debido a valores perdidos en las otras variables.
De hecho, puedes calcular diferentes medidas de correlación. Por defecto, R calcula el coeficiente de correlación estándar de Pearson. Para los datos que no se distribuyen normalmente, puede usar la función cor () para calcular la correlación de rango de Spearman o la tau de Kendall. Para esto, debe establecer el argumento de método en el valor apropiado.