Imagine o seguinte cenário: toda semana você recebe relatórios de vendas em formato CSV e precisa consolidá-los em uma única planilha para gerar um resumo.
Fazer isso manualmente pode levar horas. Mas com o Pandas, é questão de segundos.
O Pandas é uma das bibliotecas mais poderosas do ecossistema Python para análise, transformação e automação de dados.
Se você já lidou com planilhas no Excel, vai se sentir em casa, mas aqui, com muito mais poder e automação.
Preparando o ambiente
Como sempre, vamos manter nosso projeto isolado em um ambiente virtual.
python3 -m venv .venv
No Linux/macOS source .venv/bin/activate
No Windows source .venv\Scripts\activate
Instalando o Pandas
Abre o terminal:
pip install pandas openpyxl
pandas: biblioteca principal para análise de dados.
openpyxl: permite exportar para Excel (.xlsx).
Lendo um arquivo CSV
Vamos começar simples: carregar um relatório em CSV e inspecionar os dados.
relatorio-vendas.py
import pandas as pd
# Carregar o arquivo CSV
df = pd.read_csv("vendas.csv")
# Exibir as primeiras linhas
print(df.head())
Se o arquivo vendas.csv contiver algo como:
data,produto,quantidade,valor
01/08/2025,Notebook,3,3500
01/08/2025,Mouse,10,80
01/08/2025,Teclado,5,150
A saída será uma tabela organizada, semelhante a uma planilha.
python3 relatorio-vendas.py
data produto quantidade valor
0 01/08/2025 Notebook 3 3500
1 01/08/2025 Mouse 10 80
2 01/08/2025 Teclado 5 150
Filtrando e transformando dados
Agora vamos selecionar apenas vendas acima de R$ 1000.
filtro = df[df["valor"] > 1000]
print(filtro)
Resultado:
data produto quantidade valor
0 01/08/2025 Notebook 3 3500
Exportando para Excel
filtro = df
filtro.to_excel("vendas_filtradas.xlsx", index=False)
print("Relatório exportado para vendas_filtradas.xlsx")
Com isso, temos um arquivo pronto para ser compartilhado, sem precisar abrir o Excel manualmente.
Mini-projeto: Consolidando múltiplos relatórios
Imagine que você recebe vários arquivos CSV (vendas_jan.csv, vendas_fev.csv, etc.).
Podemos juntá-los em um único relatório com poucas linhas de código:
import pandas as pd
import glob
# Carregar todos os arquivos CSV
arquivos = glob.glob("vendas_*.csv")
# Concatenar em um único DataFrame
dfs = [pd.read_csv(arq) for arq in arquivos]
df_final = pd.concat(dfs, ignore_index=True)
# Salvar no Excel
df_final.to_excel("vendas_consolidadas.xlsx", index=False)
print("Relatório consolidado gerado com sucesso!")
Agora, em vez de copiar e colar manualmente dezenas de planilhas, você automatiza tudo em segundos.
Quando usar Pandas para automação
O Pandas é ideal para:
- Processar grandes volumes de dados de forma rápida.
- Automatizar tarefas repetitivas de ETL (Extract, Transform, Load).
- Transformar relatórios em insights prontos para análise.
Considerações finais
Com o Pandas, você elimina horas de trabalho repetitivo e ganha produtividade, transformando relatórios manuais em processos automáticos e confiáveis.
Feito!
Nenhum comentário:
Postar um comentário