Video: Tratamiento a valores repetidos en Excel 2025
Los datos se almacenan de diferentes maneras en diferentes sistemas. Por lo tanto, no es sorprendente que al recopilar y consolidar datos de varias fuentes, es posible que aparezcan duplicados. En particular, lo que hace único a un registro individual es diferente para diferentes sistemas.
Se adjunta un resumen de cuenta de inversión a un número de cuenta. Un resumen de la cartera puede almacenarse a nivel individual o doméstico. Y los historiales comerciales de todas esas cuentas se almacenan en el nivel de transacción individual.
Es importante tener claro qué se supone que diferencia los registros únicos en su archivo de datos. Por ejemplo, si se trata de un archivo de nivel de transacción, los números de cuenta y los ID de hogar se duplicarán. Mientras entiendas esto y estés haciendo un análisis de nivel de transacción, estarás bien.
Pero si le interesa usar esta información para analizar la cantidad de cuentas que tiene cada hogar, se encontrará con problemas. Los hogares que comercian con mayor frecuencia tendrán más registros que aquellos que no comercian mucho. Necesita tener un archivo en el nivel de la cuenta.
Eliminar registros duplicados no es particularmente difícil. La mayoría de los paquetes estadísticos y sistemas de bases de datos tienen comandos incorporados que agrupan registros juntos. (De hecho, en el lenguaje de base de datos SQL, este comando se llama Agrupar por).
