Descargo de responsabilidad: Este es para una tarea del proyecto.
Estoy tratando de encontrar el mejor modelo para los precios de los diamantes, dependiendo de varias variables, y me parece que tienen un buen modelo hasta ahora. Sin embargo he corrido en dos variables que, obviamente, son colineales:
>with(diamonds, cor(data.frame(Table, Depth, Carat.Weight)))
Table Depth Carat.Weight
Table 1.00000000 -0.41035485 0.05237998
Depth -0.41035485 1.00000000 0.01779489
Carat.Weight 0.05237998 0.01779489 1.00000000
La tabla y la Profundidad son dependientes unos de otros, pero todavía quiero incluir en mi modelo predictivo. Hice algunas investigaciones sobre los diamantes y se encontró que la Tabla y la Profundidad son la longitud a través de la parte superior y la distancia desde la parte superior a la parte inferior de la punta de un diamante. Dado que estos precios de los diamantes parecen estar relacionados con la belleza y la belleza parece estar relacionado con las proporciones, me iba a incluir a su relación, decir $\frac{Table}{Depth}$, para predecir los precios. Es este un procedimiento estándar para tratar con variables colineales? Si no, ¿qué es?
Edit: Aquí está una parcela de Profundidad ~ Tabla: