Aula demonstrativa · 15 min
Regressão
Linear

Do problema concreto ao coração matemático do modelo —
e por que esse coração se repete em toda aprendizagem de máquina.

Modelagem preditiva Minimização de erro R² e causalidade
Apollo Analytics Academy | Produzido por Igor Nascimento Vidal1 / 9
Conceito fundamental
O que é um modelo?

Um modelo é uma representação simplificada da realidade — feita para um propósito específico.

Mapa — não é o território, mas te orienta nele
Maquete — captura proporções, ignora detalhes irrelevantes
Modelo estatístico — captura padrões em dados, ignora ruído

"Todo modelo está errado. Alguns são úteis." — George Box

representação · não o território
Apollo Analytics Academy | Produzido por Igor Nascimento Vidal2 / 9
Processo de análise de dados
Da descrição à explicação

A modelagem entra depois de entendermos os dados — quando queremos ir além do "o que aconteceu" e responder "por quê" ou "quanto".

Coleta
Limpeza
Visualização
Estatística
descritiva
Modelagem ★
Interpretação
/ Decisão
ESTATÍSTICA DESCRITIVA

Média, mediana, desvio padrão, histogramas.
"O que aconteceu?"

MODELAGEM → REGRESSÃO

Relações entre variáveis, previsão de valores.
"Qual o efeito de X sobre Y?"

Apollo Analytics Academy | Produzido por Igor Nascimento Vidal3 / 9
Motivação
Um problema concreto

Temos dados de horas de estudo e nota na prova de 12 alunos. A pergunta é simples:

"Se um aluno estuda 6 horas, qual nota esperamos?"

Olhar só para os pontos não basta. Precisamos de um padrão resumido — uma reta que capture a tendência.

Apollo Analytics Academy | Produzido por Igor Nascimento Vidal4 / 9
A equação
Os parâmetros a e b
ŷ = a + b·x
a — intercepto. Valor de ŷ quando x = 0.
Onde a reta cruza o eixo vertical.
b — inclinação. Para cada +1 em x, ŷ muda b unidades.
O "efeito" de x sobre y — cuidado com causalidade!
ŷ — valor previsto, não o valor real. Sempre há resíduo.
A reta é uma média condicional de y dado x.

ponto dourado = intercepto a  |  inclinação = b

Apollo Analytics Academy | Produzido por Igor Nascimento Vidal5 / 9
Erro de ajuste
O que é um resíduo?

Cada ponto tem uma distância vertical até a reta. Essa distância é o resíduo — o erro do modelo para aquela observação.

eᵢ = yᵢ − ŷᵢ

Resíduos positivos → ponto acima da reta.
Resíduos negativos → ponto abaixo da reta.
A reta ideal minimiza esses erros em conjunto.

linhas vermelhas = resíduos (erro por ponto)

Apollo Analytics Academy | Produzido por Igor Nascimento Vidal6 / 9
O coração da regressão
Minimizar a soma dos erros quadráticos
min Σ (yᵢ − ŷᵢ)²
Eleva ao quadrado para penalizar erros grandes mais que pequenos
Elimina o cancelamento entre erros positivos e negativos
A reta ótima é a única solução analítica desse problema de otimização

Esse princípio se repete em redes neurais, gradient boosting, SVMs…
Muda a função de perda — o espírito de minimização permanece.

bolhas ∝ (resíduo)²  |  reta azul = solução OLS

Apollo Analytics Academy | Produzido por Igor Nascimento Vidal7 / 9
Calculadora interativa
Ajuste a reta — veja a SSE mudar
30
8.0
SOMA DOS ERROS QUADRÁTICOS (SSE)
SSE MÍNIMO (OLS — solução ótima)

arraste os sliders · tente chegar ao mínimo!

Apollo Analytics Academy | Produzido por Igor Nascimento Vidal8 / 9
Avaliação e interpretação
R² — e o que ele não diz
R² = 1 − SSE / SST

R² ≈ 0.98 — o modelo explica 98% da variância de Y. Os outros 2% são ruído ou variáveis não incluídas.

Correlação ≠ Causalidade.
Consumo de sorvete correlaciona com afogamentos — ambos sobem no verão. Variável omitida: temperatura.
Validade local.
Os parâmetros valem dentro do intervalo dos dados. Extrapolar é arriscar — a relação pode não continuar linear.

faixa dourada = zona de extrapolação

Apollo Analytics Academy | Produzido por Igor Nascimento Vidal9 / 9