Del curso: Python en Excel para análisis de datos

Accede al curso completo hoy mismo

Únete hoy para acceder a más de 24.900 cursos impartidos por expertos del sector.

Trabajar con valores únicos u duplicados

Trabajar con valores únicos u duplicados

Cuando te enfrentas a la exploración de datos, te interesa saber si en la muestra los valores son únicos o repetidos. El método unique, aplicado a una columna, devuelve un objeto Python donde cada valor aparece una sola vez, con independencia de la cantidad de repeticiones que tienes en la columna original. Por su parte, el método nunique aporta el número de los diferentes estados de la columna. En la columna Ocupación encuentras tres valores diferentes. Otra opción es utilizar el método value_counts, que devuelve una serie con la cantidad de repeticiones que tiene cada estado en la columna. El primero aparece seis veces y el segundo cuatro veces. Para detectar duplicados puedes utilizar el método duplicated, que devuelve una serie de valores verdadero o falso, según sean nuevos o repetidos los valores de la fila. Para contar las repeticiones, agrego un zum. Hay tres filas iguales, pero la primera vez la considera única, por tanto, solo cuenta como duplicadas las otras dos…

Contenido