6.3 Haciendo Predicciones

  • Reglas para Vivir:
    • Regresa una tibble
    • Los nombres de las columnas deben ser … Predecibles
    • Regresa el mismo número de filas que las que hay en el set de datos de entrada
      • algunos métodos predict() omiten observaciones con valores faltantes, NA. Esto es genial si es el comportamiento deseado, en caso contrario, puede ser una pesadilla.
# crear un ejemplo de set de prueba
ames_test_small <- ames_test %>% slice(1:5)

# predecir con este set
predict(lm_form_fit, new_data = ames_test_small) %>% 
  knitr::kable()
.pred
5.225621
5.223819
5.288293
5.287924
5.277263


  • Usando dplyr::bind_cols podemos combinar los resultados del método predict() con el set de prueba.
# agregar predicciones con valores observados
ames_test_small %>%
  dplyr::select(Sale_Price) %>%
  dplyr::bind_cols(predict(lm_form_fit, ames_test_small)) %>%
  # Agregar el intervalo de confidencia para el 95%:
  dplyr::bind_cols(predict(lm_form_fit, ames_test_small, type = "pred_int")) %>% 
  knitr::kable()
Sale_Price .pred .pred_lower .pred_upper
5.021189 5.225621 4.907072 5.544169
5.235528 5.223819 4.905272 5.542366
5.278525 5.288293 4.969721 5.606864
5.291147 5.287924 4.969354 5.606494
5.282169 5.277263 4.958688 5.595839