Hogar Finanzas personales Valores faltantes en sus datos: variables ficticias

Valores faltantes en sus datos: variables ficticias

Tabla de contenido:

Video: Razones Trigonométricas | Hallar un lado | Ejemplo 1 2025

Video: Razones Trigonométricas | Hallar un lado | Ejemplo 1 2025
Anonim

Uno de los problemas de datos más frecuentes y desordenados es la falta de datos. Los archivos pueden estar incompletos porque se eliminaron los registros o se llenó un dispositivo de almacenamiento. O ciertos campos de datos pueden no contener datos para algunos registros. El primero de estos problemas se puede diagnosticar simplemente verificando el recuento de registros para los archivos. El segundo problema es más difícil de tratar.

Para ponerlo en términos simples, cuando encuentre un campo que contenga valores perdidos, tiene dos opciones:

  • Ignorarlo.

  • Stick algo en el campo.

Ignorando el problema

En algunos casos, simplemente puede encontrar un solo campo con una gran cantidad de valores perdidos. Si es así, lo más fácil es ignorar el campo. No lo incluyas en tu análisis.

Otra forma de ignorar el problema es ignorar el registro. Simplemente elimine el registro que contiene los datos faltantes. Esto puede tener sentido si solo hay unos pocos registros deshonestos. Pero si hay múltiples campos de datos que contienen números significativos de valores perdidos, este enfoque puede reducir su recuento de registros a un nivel inaceptable.

Otra cosa a tener en cuenta antes de simplemente eliminar registros es cualquier señal de un patrón. Por ejemplo, suponga que está analizando un conjunto de datos relacionados con saldos de tarjetas de crédito en todo el país. Es posible que encuentre un montón de registros que muestran $ 0. 00 saldos (tal vez alrededor de la mitad de los registros). Esto no es en sí mismo una indicación de datos faltantes. Sin embargo, si todos los registros de, digamos, California muestran $ 0. 00 saldos, que indica un posible problema de valores faltantes. Y no es uno que se resuelva de manera útil eliminando todos los registros del estado más grande del país. En este caso, probablemente sea un problema de sistemas e indique que se debe crear un archivo nuevo.

En general, eliminar registros es una solución fácil, pero no ideal, para los problemas de valores perdidos. Si el problema es relativamente pequeño y no existe un patrón discernible para las omisiones, entonces puede estar bien descartar los registros ofensivos y seguir adelante. Pero a menudo se justifica un enfoque más intelectual.

Rellenar los datos faltantes

Completar los datos faltantes equivale a hacer una conjetura sobre lo que habría sido en ese campo. Hay formas buenas y malas de hacer esto. Un enfoque simple (pero malo) es reemplazar los valores perdidos por el promedio de los que no faltan. En campos no numéricos, es posible que tenga la tentación de completar los registros que faltan con el valor más común en los otros registros (el modo).

Desafortunadamente, estos enfoques todavía se utilizan con frecuencia en algunas aplicaciones comerciales.Pero son ampliamente considerados por los estadísticos como malas ideas. Por un lado, el objetivo de hacer un análisis estadístico es encontrar datos que diferencien un resultado de otro. Al reemplazar todos los registros faltantes con el mismo valor, no ha diferenciado nada.

El enfoque más inteligente es tratar de encontrar una manera de predecir de manera significativa qué valor debe ser llenado en cada registro que le falta un valor. Esto implica mirar los registros completos e intentar encontrar pistas sobre cuál podría ser el valor perdido.

Supongamos que está analizando un archivo demográfico para predecir posibles compradores de uno de sus productos. En ese archivo tiene, entre otros campos, información sobre el estado civil, el número de hijos y el número de automóviles. Por alguna razón, falta el número de autos en un tercio de los registros.

Al analizar los otros dos campos (estado civil y número de hijos), es posible que descubra algunos patrones. Las personas solteras tienden a tener un auto. Las personas casadas sin hijos tienden a tener dos autos. Las personas casadas con más de un hijo podrían tener más probabilidades de tener tres autos. De esta forma, puede adivinar los valores perdidos de una manera que realmente diferencie los registros. Más sobre este enfoque por venir.

Hay un término general en estadísticas y procesamiento de datos que se refiere a datos cuestionables. El término ruidoso se usa para describir datos que no son confiables, están corruptos o son menos que prístinos. La falta de datos es solo un ejemplo de esto. Una descripción detallada de las técnicas para limpiar datos ruidosos en general está más allá del alcance de este libro. De hecho, este es un área activa de investigación en teoría estadística. El hecho de que todo el ruido no sea tan fácil de detectar como los valores perdidos hace que sea problemático lidiar con él.

Valores faltantes en sus datos: variables ficticias

Selección del editor

QuickBooks 2014 Keyboard Shortcuts - Dummies

QuickBooks 2014 Keyboard Shortcuts - Dummies

Usa los atajos de teclado de QuickBooks 2014 que se muestran en la siguiente tabla para hacer que su día a día día contable de pequeñas empresas más fácil y más rápido. Puede ahorrar valioso tiempo y energía con estas prácticas combinaciones de teclas: Presione este atajo de PC QuickBooks Esta Ctrl + A Muestra la ventana del Gráfico de Cuentas Ctrl + C Copia su selección en el Portapapeles Ctrl + D ...

Consejos y trucos para el pedido de compra de quickBooks 2014: simulacros

Consejos y trucos para el pedido de compra de quickBooks 2014: simulacros

Debe conocer algunos artículos al crear una compra orden en QuickBooks 2013. Muchas pequeñas empresas no usan órdenes de compra. Pero cuando crecen hasta cierto tamaño, muchas empresas deciden utilizarlas porque las órdenes de compra se convierten en registros permanentes de los artículos que han pedido. Además, el uso de órdenes de compra a menudo formaliza ...

Trucos de la interfaz de usuario de quickBooks 2014: variables ficticias

Trucos de la interfaz de usuario de quickBooks 2014: variables ficticias

Para ayudar a maximizar la eficiencia. Estos son algunos consejos y técnicas que puede usar para navegar más rápidamente por el software QuickBooks 2014: para pasar rápidamente a una entrada específica en el cuadro de lista, presione la letra. Por ejemplo, presione S para pasar a la primera entrada de la lista que comienza con la letra S. Para seleccionar un ...

Selección del editor

Cómo utilizar las opciones de exposición semiautomática de su cámara digital - muñecos

Cómo utilizar las opciones de exposición semiautomática de su cámara digital - muñecos

Además de los normales modo de exposición automática, donde su cámara digital establece tanto la apertura como la velocidad de obturación, su cámara puede ofrecer autoexposición con prioridad de apertura o autoexposición con prioridad al obturador. Estas opciones ofrecen más control a la vez que le brindan el beneficio del cerebro de exposición de la cámara.

Cómo usar un filtro con su SLR digital: usar maniquíes

Cómo usar un filtro con su SLR digital: usar maniquíes

Con filtros con su dSLR es bastante fácil . Puede dedicar unos instantes a configurar y decidir qué filtro desea usar, pero pronto comenzará a tomar fotografías. Cuando te acostumbras, te vuelves más rápido con los filtros. Limpia tus filtros en casa antes de salir en tu sesión. Evaluar ...

Cómo usar el bloqueo de exposición automática (AE) en su SLR digital - Dummies

Cómo usar el bloqueo de exposición automática (AE) en su SLR digital - Dummies

El bloqueo de exposición automática (AE) en su dSLR le permite medir y enfocarse en un área de la escena, bloquear la lectura de exposición automática en la cámara, recomponer la toma y luego tomar la foto con la configuración de exposición original. ¡Suena divertido! En estos casos, se beneficiará más con el bloqueo AE: está fotografiando sujetos a contraluz. Puede ...

Selección del editor

Las diferencias entre los portales de Salesforce y las comunidades: los dummies

Las diferencias entre los portales de Salesforce y las comunidades: los dummies

Los portales y comunidades de fuerza de trabajo capacitan a sus clientes y socios al proporcionarles foro social directamente relacionado con sus procesos de negocios internos para que puedan conectarse con la información correcta y las personas adecuadas en los momentos adecuados. Según el momento en que su organización comenzó a usar Salesforce, es posible que los portales ya no sean relevantes ...

Sage Timeslips Toolbar - Dummies

Sage Timeslips Toolbar - Dummies

La barra de herramientas aparece en la parte superior de la ventana de Sage Timeslips, justo debajo de los menús, a menos que oculta la barra de herramientas usando el cuadro de diálogo de Preferencias personales. Las imágenes en algunos botones no sugieren realmente el propósito del botón, así que aquí hay algo de ayuda para ti. Y si no desea usar la barra de herramientas, seleccione Configuración → Preferencias y ...

Sabio Cuentas instantáneas para Dummies Cheat Sheet (Edición del Reino Unido) - Dummies

Sabio Cuentas instantáneas para Dummies Cheat Sheet (Edición del Reino Unido) - Dummies

Necesitan obtener un manejar sus cuentas comerciales nuevas o pequeñas? Utilice esta Hoja de referencia para obtener consejos rápidos y simples sobre cómo usar el software de Cuentas instantáneas de Sage para administrar los detalles de contabilidad dentro de la operación de su negocio.