6.3 Haciendo Predicciones

- Reglas para Vivir:
- Regresa una
tibble - Los nombres de las columnas deben ser … Predecibles
- Regresa el mismo número de filas que las que hay en el set de datos de entrada
- algunos métodos
predict()omiten observaciones con valores faltantes,NA. Esto es genial si es el comportamiento deseado, en caso contrario, puede ser una pesadilla.
- algunos métodos
- Regresa una
# crear un ejemplo de set de prueba
ames_test_small <- ames_test %>% slice(1:5)
# predecir con este set
predict(lm_form_fit, new_data = ames_test_small) %>%
knitr::kable()| .pred |
|---|
| 5.225621 |
| 5.223819 |
| 5.288293 |
| 5.287924 |
| 5.277263 |
- Usando
dplyr::bind_colspodemos combinar los resultados del métodopredict()con el set de prueba.
# agregar predicciones con valores observados
ames_test_small %>%
dplyr::select(Sale_Price) %>%
dplyr::bind_cols(predict(lm_form_fit, ames_test_small)) %>%
# Agregar el intervalo de confidencia para el 95%:
dplyr::bind_cols(predict(lm_form_fit, ames_test_small, type = "pred_int")) %>%
knitr::kable()| Sale_Price | .pred | .pred_lower | .pred_upper |
|---|---|---|---|
| 5.021189 | 5.225621 | 4.907072 | 5.544169 |
| 5.235528 | 5.223819 | 4.905272 | 5.542366 |
| 5.278525 | 5.288293 | 4.969721 | 5.606864 |
| 5.291147 | 5.287924 | 4.969354 | 5.606494 |
| 5.282169 | 5.277263 | 4.958688 | 5.595839 |