Aula demonstrativa · 15 min
Regressão
Linear
Do problema concreto ao coração matemático do modelo —
e por que esse coração se repete em toda aprendizagem de máquina.
Modelagem preditiva
Minimização de erro
R² e causalidade
Apollo Analytics Academy | Produzido por Igor Nascimento Vidal1 / 9
Conceito fundamental
O que é um modelo?
Um modelo é uma representação simplificada da realidade — feita para um propósito específico.
Mapa — não é o território, mas te orienta nele
Maquete — captura proporções, ignora detalhes irrelevantes
Modelo estatístico — captura padrões em dados, ignora ruído
"Todo modelo está errado. Alguns são úteis." — George Box
Apollo Analytics Academy | Produzido por Igor Nascimento Vidal2 / 9
Processo de análise de dados
Da descrição à explicação
A modelagem entra depois de entendermos os dados — quando queremos ir além do "o que aconteceu" e responder "por quê" ou "quanto".
Coleta
→
Limpeza
→
Visualização
→
Estatística
descritiva
→
Modelagem ★
→
Interpretação
/ Decisão
ESTATÍSTICA DESCRITIVA
Média, mediana, desvio padrão, histogramas.
"O que aconteceu?"
MODELAGEM → REGRESSÃO
Relações entre variáveis, previsão de valores.
"Qual o efeito de X sobre Y?"
Apollo Analytics Academy | Produzido por Igor Nascimento Vidal3 / 9
Motivação
Um problema concreto
Temos dados de horas de estudo e nota na prova de 12 alunos. A pergunta é simples:
"Se um aluno estuda 6 horas, qual nota esperamos?"
Olhar só para os pontos não basta. Precisamos de um padrão resumido — uma reta que capture a tendência.
Apollo Analytics Academy | Produzido por Igor Nascimento Vidal4 / 9
A equação
Os parâmetros a e b
ŷ = a + b·x
a — intercepto. Valor de ŷ quando x = 0.
Onde a reta cruza o eixo vertical.
b — inclinação. Para cada +1 em x, ŷ muda b unidades.
O "efeito" de x sobre y — cuidado com causalidade!
ŷ — valor previsto, não o valor real. Sempre há resíduo.
A reta é uma média condicional de y dado x.
ponto dourado = intercepto a | inclinação = b
Apollo Analytics Academy | Produzido por Igor Nascimento Vidal5 / 9
Erro de ajuste
O que é um resíduo?
Cada ponto tem uma distância vertical até a reta. Essa distância é o resíduo — o erro do modelo para aquela observação.
eᵢ = yᵢ − ŷᵢ
Resíduos positivos → ponto acima da reta.
Resíduos negativos → ponto abaixo da reta.
A reta ideal minimiza esses erros em conjunto.
linhas vermelhas = resíduos (erro por ponto)
Apollo Analytics Academy | Produzido por Igor Nascimento Vidal6 / 9
O coração da regressão
Minimizar a soma dos erros quadráticos
min Σ (yᵢ − ŷᵢ)²
Eleva ao quadrado para penalizar erros grandes mais que pequenos
Elimina o cancelamento entre erros positivos e negativos
A reta ótima é a única solução analítica desse problema de otimização
Esse princípio se repete em redes neurais, gradient boosting, SVMs…
Muda a função de perda — o espírito de minimização permanece.
bolhas ∝ (resíduo)² | reta azul = solução OLS
Apollo Analytics Academy | Produzido por Igor Nascimento Vidal7 / 9
Calculadora interativa
Ajuste a reta — veja a SSE mudar
30
8.0
SOMA DOS ERROS QUADRÁTICOS (SSE)
—
SSE MÍNIMO (OLS — solução ótima)
—
arraste os sliders · tente chegar ao mínimo!
Apollo Analytics Academy | Produzido por Igor Nascimento Vidal8 / 9
Avaliação e interpretação
R² — e o que ele não diz
R² = 1 − SSE / SST
R² ≈ 0.98 — o modelo explica 98% da variância de Y. Os outros 2% são ruído ou variáveis não incluídas.
Correlação ≠ Causalidade.
Consumo de sorvete correlaciona com afogamentos — ambos sobem no verão. Variável omitida: temperatura.
Validade local.
Os parâmetros valem dentro do intervalo dos dados. Extrapolar é arriscar — a relação pode não continuar linear.
faixa dourada = zona de extrapolação
Apollo Analytics Academy | Produzido por Igor Nascimento Vidal9 / 9