Lección 7.2 : ¿Qué es matplotlib? Usos para graficar en pandas
Lección 7.2: ¿Qué es matplotlib? Usos para graficar en pandas
Introducción
En esta lección, Yuscu Mejía nos enseñará cómo utilizar matplotlib
para graficar datos en Pandas. Exploraremos las funciones básicas de matplotlib
y cómo integrarlas con Pandas para crear visualizaciones efectivas y atractivas utilizando un DataFrame ya cargado en una biblioteca.
Características
El uso de matplotlib
en Pandas ofrece las siguientes características:
matplotlib
: Una biblioteca poderosa para la creación de gráficos en Python.- Integración con Pandas: Facilita la visualización directa de datos almacenados en DataFrames.
- Versatilidad: Permite la creación de una amplia variedad de gráficos, desde simples gráficos de líneas hasta complejos gráficos de dispersión y de barras.
- Personalización: Ofrece una alta capacidad de personalización para adaptar los gráficos a las necesidades específicas.
Ejemplos
A continuación, Yuscu Mejía nos muestra algunos ejemplos de cómo utilizar matplotlib
para graficar datos en Pandas utilizando un DataFrame ya cargado de la biblioteca seaborn
:
- Creación de un gráfico de líneas para mostrar la tendencia de un conjunto de datos.
- Generación de un gráfico de barras para comparar diferentes categorías.
- Uso de gráficos de dispersión para visualizar la relación entre dos variables.
# Importar seaborn, pandas y matplotlib
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
# Cargar el DataFrame 'tips' de seaborn
df = sns.load_dataset('tips')
# Crear gráfico de líneas
plt.plot(df['day'], df['total_bill'], marker='o')
plt.title('Total Bill por Día')
plt.xlabel('Día')
plt.ylabel('Total Bill')
plt.show()
# Crear gráfico de barras
df.groupby('day')['total_bill'].mean().plot(kind='bar', title='Media de Total Bill por Día')
plt.xlabel('Día')
plt.ylabel('Media de Total Bill')
plt.show()
# Crear gráfico de dispersión
plt.scatter(df['total_bill'], df['tip'])
plt.title('Relación entre Total Bill y Tip')
plt.xlabel('Total Bill')
plt.ylabel('Tip')
plt.show()
Práctica
Aprende a utilizar matplotlib
para graficar en Pandas siguiendo nuestro tutorial en video, presentado por Yuscu Mejía:
Ejercicio 1: Gráfico de Líneas
Utiliza matplotlib
para crear un gráfico de líneas en Pandas utilizando un DataFrame cargado de seaborn.
- a) Carga el DataFrame ‘tips’ de seaborn.
- b) Utiliza
plt.plot()
para crear un gráfico de líneas que muestre la tendencia de las propinas a lo largo de los días.
Ejercicio 2: Gráfico de Barras
Utiliza matplotlib
para crear un gráfico de barras en Pandas.
- a) Carga el DataFrame ‘tips’ de seaborn.
- b) Agrupa los datos por día y calcula la media del total de facturas. Utiliza
df.plot(kind='bar')
para generar un gráfico de barras.
#Ejercicio 1
a) Gráfico de Líneas
import seaborn as sns
import matplotlib.pyplot as plt
# Cargar el DataFrame 'tips' de seaborn
df = sns.load_dataset('tips')
# Crear gráfico de líneas para mostrar las propinas por día
plt.plot(df['day'], df['tip'], marker='o')
plt.title('Propinas por Día')
plt.xlabel('Día')
plt.ylabel('Propinas')
plt.show()
b) Gráfico de Barras
# Crear gráfico de barras para mostrar la media del total de facturas por día
df.groupby('day')['total_bill'].mean().plot(kind='bar', title='Media de Total Bill por Día')
plt.xlabel('Día')
plt.ylabel('Media de Total Bill')
plt.show()