6.3 Haciendo Predicciones
- Reglas para Vivir:
- Regresa una
tibble
- Los nombres de las columnas deben ser … Predecibles
- Regresa el mismo número de filas que las que hay en el set de datos de entrada
- algunos métodos
predict()
omiten observaciones con valores faltantes,NA
. Esto es genial si es el comportamiento deseado, en caso contrario, puede ser una pesadilla.
- algunos métodos
- Regresa una
# crear un ejemplo de set de prueba
<- ames_test %>% slice(1:5)
ames_test_small
# predecir con este set
predict(lm_form_fit, new_data = ames_test_small) %>%
::kable() knitr
.pred |
---|
5.225621 |
5.223819 |
5.288293 |
5.287924 |
5.277263 |
- Usando
dplyr::bind_cols
podemos combinar los resultados del métodopredict()
con el set de prueba.
# agregar predicciones con valores observados
%>%
ames_test_small ::select(Sale_Price) %>%
dplyr::bind_cols(predict(lm_form_fit, ames_test_small)) %>%
dplyr# Agregar el intervalo de confidencia para el 95%:
::bind_cols(predict(lm_form_fit, ames_test_small, type = "pred_int")) %>%
dplyr::kable() knitr
Sale_Price | .pred | .pred_lower | .pred_upper |
---|---|---|---|
5.021189 | 5.225621 | 4.907072 | 5.544169 |
5.235528 | 5.223819 | 4.905272 | 5.542366 |
5.278525 | 5.288293 | 4.969721 | 5.606864 |
5.291147 | 5.287924 | 4.969354 | 5.606494 |
5.282169 | 5.277263 | 4.958688 | 5.595839 |