![]() |
![]() |
Un dispositivo gráfico Biplot para modelar
relaciones
entre dos conjuntos de variables
A Biplot graphical tool to model the relationships
between two sets of variables
Maura Vásquez
Postgrado en Estadística
Universidad Central de Venezuela (UCV)
E-mail: mauravasquez@cantv.net
Guillermo Ramírez
Postgrado en Estadística
Universidad Central de Venezuela (UCV)
E-mail: guiram@cantv.net
Alberto Camardiel
Postgrado en Estadística
Universidad Central de Venezuela (UCV)
E-mail: acamar@reacciun.ve
Tomás Aluja
Universidad Politécnica de Cataluña
España
E-mail: tomas.aluja@upc.edu
RESUMEN
En la regresión multivariante se analizan relaciones entre un conjunto de indicadores de
un determinado fenómeno (variables y’s) y otro de variables explicativas (variables x’s).
Previo a la modelación resulta útil contar con información clave sobre las relaciones entre
ambos. En este sentido, se presenta un gráfico desarrollado por Ter Braak (1990) y por Ramírez
et al. (2005) en forma independiente. Se proponen indicadores de la calidad de las
aproximaciones: a) variables y’s bien explicadas por las x’s, b) agrupaciones de variables y’s
cuyas estimaciones presentan fuertes correlaciones y c) subconjuntos de variables explicativas
que presentan mayor correlación con una variable y particular. El gráfico presentado
es un GH-Biplot generalizado (Gabriel, 1971) que utiliza variables latentes generadas por
un análisis de correlación canónico. Se evalúan sus alcances en una aplicación en la que
se explica el comportamiento de los indicadores que conforman el Índice de Desarrollo
Humano en términos de otras variables del entorno social y económico a nivel estadal en
Venezuela. |
ABSTRACT
Multivariate multiple regression analysis is used to model the relationships between two sets
of variables, the y-set of response variables and the x-set of explaining variables. In trying
to have useful information about the nature of the relationships between the two sets, Ter
Braak (1990) proposed a graphical display taken up again by Ramírez et al. (2005) in an
independent way. In this paper, indexes of the quality approach are considered: a) those
y variables better explained by x variables, b) clusters of y variables whose predictions are
strongly correlated and c) subsets of x variables more correlated with a specific y variable.
The graphical device considered is a generalized GH-Biplot (Gabriel, 1971) using latent
variables generated by a canonical correlation analysis. The graphical display was used
to analyze the Human Development Index corresponding to the 23 states of Venezuela
related to several social and economic indicators. |