Question
Usando Python - Ahora usamos boosting y random forest para predecir Salary en el conjunto de datos Hitters. (a) Elimina las observaciones para las cuales
Usando Python - Ahora usamos boosting y random forest para predecir Salary en el conjunto de datos Hitters. (a) Elimina las observaciones para las cuales la informacin salarial es desconocida, y luego transforma logartmicamente los salarios. (b) Usa AtBat, Hits, Years, Runs como predictores y log-salary como respuesta. Divide los datos en el conjunto de datos de entrenamiento y prueba usando la funcin de divisin de prueba de entrenamiento, con 200 muestras en el conjunto de entrenamiento. Usa random state=24 en la funcin. (c) Realiza boosting en el conjunto de entrenamiento con 1,000 rboles para un rango de valores del parmetro de contraccin = [0.001, 0.002, 0.005, 0.01, 0.02, 0.05]. Produce un grfico con diferentes valores de contraccin en el eje x y el MSE del conjunto de entrenamiento y el MSE del conjunto de prueba correspondientes en el eje y. Sea random state=24. (d) Qu parmetro de contraccin admite el mejor MSE de prueba? Cul es el MSE de prueba correspondiente? (e) Realice el bosque aleatorio en el conjunto de entrenamiento con 1000 rboles para un rango de valores del alfa ccp = [0,01, 0,02, 0,03, 0,04, 0,05, 0,06, 0,07] Produzca un grfico con diferentes valores de alfa ccp en el eje x y el MSE del conjunto de entrenamiento y el MSE del conjunto de prueba correspondientes en el eje y. Sea estado aleatorio = 24. (f) Qu alfa ccp admite el mejor MSE de prueba? Cul es el MSE de prueba correspondiente? (g) Cul es el MSE de prueba para usar regresin lineal?
Step by Step Solution
There are 3 Steps involved in it
Step: 1
Get Instant Access to Expert-Tailored Solutions
See step-by-step solutions with expert insights and AI powered tools for academic success
Step: 2
Step: 3
Ace Your Homework with AI
Get the answers you need in no time with our AI-driven, step-by-step assistance
Get Started