Lección 4.1: Subset de datos Iloc vs Loc
Subset de datos Iloc vs Loc en pandas
Introducción
¡Hola a todos! Soy Yuscu Mejía y en esta lección vamos a aprender sobre cómo hacer subsetting de datos en pandas utilizando iloc
y loc
. Estos métodos son fundamentales para seleccionar y filtrar datos de DataFrames.
Conceptos Básicos
Las funciones que exploraremos en esta lección son:
iloc
: Permite seleccionar datos por índice de posición (enteros).loc
: Permite seleccionar datos por etiquetas de índice (nombres).
Ejemplos
A continuación, Yuscu Mejía te mostrará algunos ejemplos de cómo utilizar estos métodos con pandas:
- Utilizar
iloc
para seleccionar filas y columnas por posición. - Utilizar
loc
para seleccionar filas y columnas por etiqueta.
# Importar Pandas
import pandas as pd
# Crear un DataFrame
data = {
'Nombre': ['Ana', 'Luis', 'Carlos', 'María', 'Juan'],
'Edad': [23, 34, 45, 29, 32],
'Salario': [50000, 60000, 70000, 55000, 65000]
}
df = pd.DataFrame(data)
# Seleccionar datos usando iloc
print("Seleccionar la primera fila usando iloc:")
print(df.iloc[0])
print("\nSeleccionar las primeras tres filas y dos columnas usando iloc:")
print(df.iloc[:3, :2])
# Seleccionar datos usando loc
print("\nSeleccionar la fila con etiqueta 1 usando loc:")
print(df.loc[1])
print("\nSeleccionar las filas con etiquetas 1 a 3 y columnas 'Nombre' y 'Edad' usando loc:")
print(df.loc[1:3, ['Nombre', 'Edad']])
Práctica
Explora cómo aplicar estos métodos para hacer subsetting de datos en pandas siguiendo nuestro tutorial en video presentado por Yuscu Mejía:
Ejercicio 1: Subsetting de datos
Con la guía de Yuscu Mejía, realiza las siguientes tareas utilizando un DataFrame:
- a) Selecciona la segunda fila utilizando
iloc
. - b) Selecciona las últimas dos filas y las primeras dos columnas utilizando
iloc
. - c) Selecciona la fila con etiqueta 2 utilizando
loc
. - d) Selecciona las filas con etiquetas 0 a 2 y columnas ‘Nombre’ y ‘Salario’ utilizando
loc
.
#Ejercicio 1
a-d) Subsetting de datos
import pandas as pd
# Crear un DataFrame
data = {
'Nombre': ['Ana', 'Luis', 'Carlos', 'María', 'Juan'],
'Edad': [23, 34, 45, 29, 32],
'Salario': [50000, 60000, 70000, 55000, 65000]
}
df = pd.DataFrame(data)
# Seleccionar la segunda fila utilizando iloc
print("Segunda fila utilizando iloc:")
print(df.iloc[1])
# Seleccionar las últimas dos filas y las primeras dos columnas utilizando iloc
print("\nÚltimas dos filas y primeras dos columnas utilizando iloc:")
print(df.iloc[-2:, :2])
# Seleccionar la fila con etiqueta 2 utilizando loc
print("\nFila con etiqueta 2 utilizando loc:")
print(df.loc[2])
# Seleccionar las filas con etiquetas 0 a 2 y columnas 'Nombre' y 'Salario' utilizando loc
print("\nFilas con etiquetas 0 a 2 y columnas 'Nombre' y 'Salario' utilizando loc:")
print(df.loc[0:2, ['Nombre', 'Salario']])