Del curso: Python en Excel para análisis de datos
Accede al curso completo hoy mismo
Únete hoy para acceder a más de 24.900 cursos impartidos por expertos del sector.
Trabajar con valores únicos u duplicados
Del curso: Python en Excel para análisis de datos
Trabajar con valores únicos u duplicados
Cuando te enfrentas a la exploración de datos, te interesa saber si en la muestra los valores son únicos o repetidos. El método unique, aplicado a una columna, devuelve un objeto Python donde cada valor aparece una sola vez, con independencia de la cantidad de repeticiones que tienes en la columna original. Por su parte, el método nunique aporta el número de los diferentes estados de la columna. En la columna Ocupación encuentras tres valores diferentes. Otra opción es utilizar el método value_counts, que devuelve una serie con la cantidad de repeticiones que tiene cada estado en la columna. El primero aparece seis veces y el segundo cuatro veces. Para detectar duplicados puedes utilizar el método duplicated, que devuelve una serie de valores verdadero o falso, según sean nuevos o repetidos los valores de la fila. Para contar las repeticiones, agrego un zum. Hay tres filas iguales, pero la primera vez la considera única, por tanto, solo cuenta como duplicadas las otras dos…
Practica mientras aprendes con los archivos de ejercicios.
Descarga los archivos que el instructor utiliza para enseñar el curso. Sigue las instrucciones y aprende viendo, escuchando y practicando.
Contenido
-
-
-
-
-
(Bloqueado)
Obtener información sobre la estructura del dataframe2 min 7 s
-
(Bloqueado)
La función head para descubrir el contenido de una muestra de datos1 min 34 s
-
(Bloqueado)
Obtener datos desde la proyección de una o más columnas2 min 9 s
-
(Bloqueado)
Obtener información sobre tipos de datos1 min 41 s
-
(Bloqueado)
Descubrir la estadística de los datos con la función describe1 min 53 s
-
(Bloqueado)
Describir columnas de texto y obtener sus estadísticas1 min 55 s
-
Identificar valores nulos2 min 15 s
-
(Bloqueado)
Trabajar con valores únicos u duplicados1 min 38 s
-
(Bloqueado)
Comprobar el orden de definición y referencia para evaluar los objetos1 min 50 s
-
(Bloqueado)
-
-
-