Índices de precios de renta de la vivienda en México basados en la ENIGH

Rental Housing Price Indexes in Mexico Based on ENIGH

 

Jesús López Pérez y Francisco de Jesús Corona Villavicencio
Instituto Nacional de Estadística y Geografía (INEGI), jesus.lopezp@inegi.org.mx y franciscoj.corona@inegi.org.mx, respectivamente.

Nota: nuestro agradecimiento a Gerardo Leyva Parra, director general adjunto de Investigación, por sus valiosas aportaciones realizadas; también a Xavier Herrera, quien aportó puntuales comentarios sobre el borrador de este artículo.

Vol. 13, núm. 3EPUB                                                              Índices de precios… –  EPUB

RDE38_art05_img00

 

Este documento aborda el problema de la construcción de índices de precios de vivienda en alquiler para el mercado de vivienda mexicano, tanto para las rentadas como aquellas ocupadas por sus dueños. Utilizando datos de cinco ediciones de la Encuesta Nacional de Ingresos y Gastos de los Hogares, primero se construye un Indicador de Calidad de las Viviendas (ICV) para reducir la variabilidad de 26 variables categóricas relacionadas con materiales de vivienda, acceso a servicios públicos y equipamiento de esta; luego, presentamos tres metodologías de índices de precios que son construidos a partir del ICV y dos variables geográficas. Este puede reducir, al menos, 77 % de la variabilidad de las variables categóricas, con el cual se puede construir en un modelo parsimonioso para estimar precios de alquiler ajustados por la calidad de la vivienda. El Índice de Precios Hedónicos estima un incremento anual promedio de 2.6 % del 2010 al 2018 a nivel nacional; además, el Índice Estratificado de Precios muestra que las localidades rurales han experimentado mayor volatilidad que las urbanas, mientras que el Índice Espacial de Precios permite afirmar que Campeche, Ciudad de México y Quintana Roo, usualmente, presentan precios más elevados que la entidad de referencia (estado de México), mientras que Durango, Tlaxcala y Coahuila de Zaragoza suelen tenerlos más bajos que esta.                                                             

Palabras clave: precios de vivienda; Índice de Precios Hedónicos; propensity Score Matching; Análisis de Correspondencia Múltiple.

 

This paper addresses the problem of constructing rental housing price indexes for the Mexican housing market, both for rented and owner-occupied housing. Using data from five editions of the National Survey of Household Income and Expenditures (ENIGH), we first construct a Housing Quality Indicator (HQI) to reduce the variability of 26 categorical variables related to housing materials, access to public services and housing equipment; then, we present three price index methodologies that are constructed from the HQI and two geographic variables. This can reduce at least 77% of the variability of the categorical variables, which can be used to build a parsimonious model to estimate rental prices adjusted for housing quality. The Hedonic Price Index estimates an average annual increase of 2.6 % from 2010 to 2018 at the national level; in addition, the Stratified Price Index shows that rural localities have experienced greater volatility than urban ones, while the Spatial Price Index allows us to affirm that Campeche, Mexico City and Quintana Roo usually have higher prices than the reference entity (state of Mexico), while Durango, Tlaxcala and Coahuila de Zaragoza usually have lower prices than the reference entity (state of Mexico).                                                                                                         

Key words: housing prices; Hedonic Price Index; Propensity Score Matching; Multiple Correspondence Analysis.

 

Recibido: 6 de julio de 2021
Aceptado: 31 de marzo de 2022

 

Introducción

El mercado de vivienda residencial enfrenta el reto de contar con precios que reflejen la calidad de los activos que, a diferencia de otros mercados, se caracterizan por ser muy heterogéneos; cada vivienda es diferente. Mientras que, por ejemplo, en la construcción de índices de precios de alimentos es posible registrar y dar seguimiento a un mismo producto (pan de caja de cierto tamaño o el kilo de pollo, por ejemplo) y este no varía de ciudad en ciudad, esto no es posible de medir de manera directa para los precios de las viviendas, los cuales se ven influenciados, principalmente, por su ubicación geográfica y el conjunto de atributos propios, que también se pueden considerar únicos. Otros aspectos que inciden en la medición son la depreciación (que disminuye su valor), las renovaciones (que lo incrementa) y el hecho de que las transacciones son esporádicas. Así, en la construcción de índices de precios, un aspecto crítico es logar la comparabilidad en periodos sucesivos de precios transaccionales de bienes y servicios semejantes (Silver, 2016).

En México se han desarrollado índices de precios de vivienda para compra de vivienda nueva y usada (SHF, 2020); sin embargo, en la actualidad no se conoce de estudios en el país relacionados con la construcción de índices de precios de renta que utilicen la información de la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH).[1] Si bien existe, como parte del Índice Nacional de Precios al Consumidor, información del genérico Renta de vivienda para tres niveles (alta, media y baja), este se realiza con base en un muestreo no probabilístico (INEGI, 2018).

En este trabajo se estiman índices de precios de renta de vivienda en México ajustados por la calidad de las viviendas, con base en tres metodologías rescatadas de Zamudio et al. (2020) que pretenden capturar la heterogeneidad de estas: Índice de Precios Hedónicos (IPH), Estratificado de Precios (IEstrP) y Espacial de Precios (IEspP). Los datos provienen de la ENIGH, la cual es bienal (ediciones del 2010 al 2018). Se utiliza la información tanto de viviendas rentadas, de las que se conoce el monto de renta pagado, así como de las utilizadas por sus dueños o prestadas, de las cuales se sabe la cantidad que se estaría pagando si se rentaran (renta imputada) junto con los datos de las características físicas de las viviendas. La aportación de esta investigación consiste en desarrollar un Indicador de Calidad de las Viviendas (ICV) mediante la técnica de Análisis de Correspondencia Múltiple (MCA, por sus siglas en inglés), el cual resume en una sola variable toda la información de las características de las viviendas disponible en la ENIGH. La inclusión de este en los índices de precios permite controlar estadísticamente los efectos de las características únicas de cada vivienda.

El presente estudio es relevante para apoyar el análisis de políticas públicas de vivienda orientadas al uso de inmuebles rentados. En México no se cuenta con programas sociales de apoyo en este sentido, por ejemplo, como los sugeridos en Bergman et al. (2019) para apoyar la movilidad social al permitir que familias puedan restablecerse en localidades con mejor acceso a servicios educativos y de salud. La información que aquí se genera puede ser de utilidad para diseñar programas de apoyo a la renta de vivienda y también para apoyar en la estimación de rentas imputadas para las cifras de contabilidad nacional.

Enseguida de esta introducción, este documento se divide en cinco apartados: en primera instancia se presenta una revisión de literatura; después se describen los datos de la ENIGH y las variables empleadas; en tercer lugar se muestra el Indicador de Calidad de las Viviendas; luego se dan los resultados de los índices de precios de renta estimados; y en la última parte se emiten conclusiones con base en los resultados de los tres métodos.

Mercado de renta de vivienda en México

Nos interesa, en particular, el mercado de vivienda rentada, que en el país asciende a 13 % del total de viviendas (INEGI, ENIGH 2018). En naciones de América Latina, la proporción de hogares que rentan una vivienda alcanza 21%, mientras para las que pertenecen a la Organización para la Cooperación y el Desarrollo Económicos (OCDE) es de 24 por ciento.[2]

La política de vivienda en México de recientes administraciones se ha caracterizado por incentivar la demanda mediante el financiamiento a la adquisición de inmuebles a través de las entidades financieras del gobierno: INFONAVIT para trabajadores de la economía formal privada y FOVISSSTE para los del servicio público. Muestra de ello son los fuertes niveles de colocación de créditos hipotecarios: mientras que en el 2000 se otorgaron, aproximadamente, 477 mil financiamientos, en el 2008 llegaron a un máximo de 2 millones 10 mil y, a raíz de la gran recesión de ese año, decrecieron hasta 945 mil en el 2019, antes de la pandemia (SNIIV[3]).

Por su parte, el mercado de vivienda en renta se ha desarrollado en menor medida. Entre el 2010 y 2020, de acuerdo con los censos de población y vivienda, la proporción de unidades alquiladas pasó de 14 a 17.3 %, un aumento de 3.3 % en 10 años. Además, la misma fuente señala que hay 15.8 % del total de viviendas que son prestadas, lo que supondría la existencia de un mercado informal de rentas. Una dimensión importante de los mercados de renta es que estos se encuentran más desarrollados en localidades urbanas. Según la Encuesta Nacional de Vivienda (ENVI),[4] el porcentaje de vivienda alquilada en ciudades de más de 100 mil habitantes es de 21.8; en las de 15 mil a menos de 100 mil, de 19.7; en las de 2 500 a menos de 15 mil, de 11.5; y en las más pequeñas, de menos de 2 500 habitantes, se ubica en 4.1.

El arrendamiento de una vivienda se genera cuando este representa una mejor opción para ciertos hogares en los que comprar una propiedad no se ajusta a sus posibilidades. De acuerdo con la ENVI 2020, la distribución porcentual de viviendas rentadas por motivo principal de alquiler es: no tiene acceso a crédito o recursos (51.4), por facilidad para mudarse (22), la mensualidad es menor que la hipoteca (9.7), no le interesa comprar (5.4), prefiere invertir en su persona (3.3), otros (8). De hecho, en ONU-Hábitat e INFONAVIT (2018) se indica que, tomando como referencia el precio promedio del inmueble financiado por los organismos de vivienda, los hogares más pobres tardarían 120 años para pagarlo y más de 47 años para liquidar uno de tipo económico.

La utilización de vivienda desocupada, que en México asciende a 650 mil viviendas deshabitadas (SEDATU, 2019), a través de mecanismos que fomenten la renta tiene beneficios para las ciudades al evitar la edificación de nuevas unidades que demandan servicios públicos e infraestructura y aprovechar el inventario de inmuebles existentes.

Metodologías

En la literatura de índices de precios se han desarrollado, principalmente, cuatro que permiten hacer compatibles viviendas en diferentes locaciones y con distintas características: regresión hedónica, estratificación, ventas repetidas y basado en avalúos (Eurostat, 2013). Con base en la información disponible proveniente de la ENIGH, en este trabajo se desarrollan los primeros dos: IEstrP e IPH. Además, siguiendo a Zamudio et al. (2020), se realiza un ejercicio de IEspP con la metodología de Galvis y Carrillo (2013).

Metodología del IPH

Se emplean regresiones hedónicas, cuyos fundamentos fueron propuestos inicialmente por Lancaster (1966) y Rosen (1974). En el modelo hedónico se supone que los individuos escogen una vivienda con base en el bienestar que esperan recibir de los atributos que la componen, por lo que es posible estimar precios ajustados por calidad, más allá de buscar la estimación directa de cada una de las características.

En el caso particular de viviendas, tenemos que el precio Pi,t de una vivienda en el periodo t es una función de un número fijo, K, de características medidas por las cantidades zik,t  y un error aleatorio εi,t (ruido blanco). Considerando T + 1 periodos, desde el periodo base 0 hasta el T, tenemos:

                                             Pi,t = f (zi1,t,…,ziK,ti,t),                                     (1)

desde t = 0,…, T.

La representación anterior es una generalización del modelo del desarrollador que descompone el precio de una vivienda solo en dos características: el costo de la tierra (L, usualmente metros cuadrados) y el de la estructura (S, el total de los materiales utilizados para la construcción), de manera que el precio lo podemos definir por la expresión:

                                            pi,t = βtLi,t + γtSi,t + εi,t,                                    (2)

para t = 1,…, T, el número de periodos; i = 1,…, N, el total de viviendas; y εi,t es un término de error aleatorio con media 0. En este modelo, los factores L y S pueden ampliarse para considerar otras H características que afectan la calidad de la tierra Xi1,t,…, XiH,t y otras J características que impactan la calidad de la estructura Yi1,t,…, YiH,t, con lo que llegamos a la expresión:

RDE38_art05_form03

Como parte de las características de la calidad de la tierra se pueden considerar: si la vivienda se encuentra ubicada en una intersección de calles o en un callejón, cerca de un centro comercial o no y diversas variables dummy de ubicación. Las siguientes variables se pueden considerar que afectan la calidad de la estructura: número de recámaras, baños y garajes; antigüedad de la vivienda; tipos de material de piso y techo; presencia de patio; aire acondicionado; etcétera.

Para poder estimar las contribuciones marginales de las características, se utilizan métodos de regresión, por lo que esta última ecuación se reexpresa como un modelo paramétrico. Las dos mejores especificaciones hedónicas son el modelo lineal:

RDE38_art05_form04

y el log-lineal:

RDE38_art05_form05

donde β0,t y βk,t son el intercepto y los parámetros de las características a ser estimadas. Es preferible utilizar el modelo log-lineal cuando se está en presencia de heteroscedasticidad en los errores (varianza no constante en los errores) dado que los precios tienden a distribuirse log-normal. En la práctica, muchas de las variables explicatorias pueden ser categóricas en vez de continuas, y están representadas por un conjunto de variables dummy que toman el valor 1 si la vivienda tiene la categoría en comento o 0 en caso contrario.

Habiendo estimado los parámetros RDE38_art05_ft01, se realizan las predicciones de los precios de una vivienda característica, N*, para lo cual se hace uso de las características promedio de esta, RDE38_art05_ft02, y se procede enseguida a la estimación del índice de precios del inmueble como se describe a continuación. En primer lugar, se construye un índice de precios tipo Laspeyres entre el periodo 0 y el t:

RDE38_art05_form06

Enseguida, se calcula también uno de tipo Paasche:

RDE38_art05_form07

donde RDE38_art05_ft03 es el coeficiente estimado del intercepto en el periodo base; RDE38_art05_ft04, el del intercepto en el periodo t; RDE38_art05_ft05 , el de la i-ésima característica (precio hedónico de la característica i), en el periodo base; RDE38_art05_ft06, el de la i-ésima característica (precio hedónico de la característica i), en el periodo t; RDE38_art05_ft07, el valor promedio de la i-ésima característica de la vivienda en el periodo base; y RDE38_art05_ft08, el valor promedio de la i-ésima característica de la vivienda en el periodo t.

Finalmente, con base en ambos índices, se obtiene su media geométrica para obtener el índice tipo Fisher:

RDE38_art05_form08

Metodología del IEstrP

El Índice Estratificado de Precios está basado en la separación del total de viviendas en la muestra en un número m de submuestras o estratos, y permite establecer la importancia o peso que cada una de estas submuestras tiene respecto a todas las demás, el cual podemos representar a través de la siguiente expresión:

RDE38_art05_form09

donde Pm,t es el precio del estrato m que compara el precio promedio en el periodo t con el de un periodo anterior o periodo base 0, y donde wm0 denota el peso del estrato m en el periodo base. Los pesos representan la ponderación del estrato al total, basada usualmente en el número de viviendas, y que se mantienen fijos respecto al periodo base, que suele ser de un año aun cuando la periodicidad del índice sea mensual o trimestral.

El siguiente paso es agregar los precios y las cantidades con base en los ponderadores en un solo índice de precios; para ello, se emplean el Índice de Laspeyres, RDE38_art05_ft09, en el periodo t, que está dado por:

RDE38_art05_form10

De manera similar se puede definir la fórmula para el Índice de Paasche, RDE38_art05_ft10 de la siguiente manera:

RDE38_art05_form11

Con estos dos índices se obtiene el Índice de Fisher, definido como el promedio geométrico de RDE38_art05_ft09 y RDE38_art05_ft10 :

            RDE38_art05_form12

Metodología del IEspP

Esta se basa en el ejercicio de Galvis y Carrillo (2013), quienes hacen una aplicación para la vivienda urbana en Colombia. Para calcular índices de precio espaciales, se utilizan también regresiones hedónicas, pero en primer lugar se realiza un procedimiento estadístico, conocido como matching, para hacer comparables las muestras entre dos regiones espaciales. Posteriormente, se comparan los precios de una vivienda en la entidad control vis a vis los de una similar en la otra entidad; para ello, se estiman coeficientes para los atributos de la vivienda, y al final se calculan precios promedio que se utilizan para construir el índice.

El procedimiento de emparejamiento empleado es el algoritmo PSM (por sus siglas en inglés, Propensity Score Matching) para homologar muestras uno a uno, el cual busca determinar el efecto que ocasiona un suceso sobre un grupo de individuos u observaciones. Fue propuesto por Rosenbaum & Rubin (1983) y Rubin (1976). A través del PSM se pueden identificar viviendas con características similares entre una entidad control y otra, de esta manera se busca que los índices reflejen los diferenciales de precios y no las variaciones en los atributos de las viviendas.

Sea x el vector de covariables para una vivienda en particular y sea la variable que indica si esta se encuentra en el estado de control (z = 1) o en la entidad de emparejamiento (z = 0). La medida de propensión (PS propensity score), e(x), es la probabilidad condicional de estar en el estado de control dadas las covariables, e(x) = P(z = 1|x). De esta manera, con respecto a las viviendas de la entidad control son seleccionadas aquellas en la otra entidad que tienen la mínima diferencia de e(x), es decir, se busca que tengan la misma distribución de x. Para determinar el valor de e(x), se utilizan modelos probit, cuyos resultados son utilizados a manera de función distancia, es decir, se elige el par de viviendas, una en la entidad control y la otra en la de interés, cuya distancia sea menor. En este sentido, para una vivienda j del estado de México (entidad control) será similar a la vivienda i del estado r si se satisface la siguiente relación, comparando una vivienda a la vez:

D(i)={jEdoMex::min( |pipj |)},

donde D (·) es la contrafactual de la vivienda i en la entidad r, p es el PS, y el término EdoMex denota la entidad control estado de México.[5]

Una vez que se ha encontrado el conjunto de parejas de viviendas homogéneas se realizan regresiones hedónicas, con la metodología descrita en la sección de índices de precios hedónicos, con lo cual se permite asumir que las diferencias en precio representan el diferencial en el costo de vida de cada entidad o debido a factores de localización. Para comparar los precios entre las entidades, se construyen índices de precios Paasche, Laspeyres y de Fisher, que combina a los dos primeros; la expresión para obtener este resultado es la siguiente:

    RDE38_art05_form13

donde RDE38_art05_ft11 es el coeficiente estimado del intercepto en el periodo t; RDE38_art05_ft12, el del intercepto en el periodo base; RDE38_art05_ft13, el valor promedio de la i-ésima característica de la vivienda en el periodo t; RDE38_art05_ft14 , el valor promedio de la i-ésima característica de la vivienda en el periodo base; RDE38_art05_ft15, el coeficiente estimado de la i-ésima característica (precio hedónico de la característica i), en el periodo t; y RDE38_art05_ft16, el de la i-ésima característica (precio hedónico de la característica i), en el periodo base.

Esta expresión permite comparar los precios entre la entidad federativa r y la control, donde entre más bajo sea el valor del índice, más barata es la entidad federativa en comento respecto al estado de México. La comparación relativa de los precios de vivienda que genera el Índice Espacial de Precios de vivienda ayuda a reconocer las disparidades existentes en los precios de vivienda entre las entidades federativas, lo cual puede motivar el diseño de políticas públicas que reconozcan estas diferencias, por ejemplo, para la modificación de políticas de otorgamiento de créditos.

Datos

En este apartado se presenta un resumen de las bases de datos utilizadas tanto para la construcción del ICV como en la elaboración de los índices de precios. Se utiliza la información de la ENIGH para los años 2010, 2012, 2014, 2016 y 2018.

La variable de mayor interés para este trabajo es el importe pagado por el uso de la vivienda. Para la de alquiler corresponde al monto del pago mensual reportado por el encuestado (renta), mientras que para las viviendas ocupadas por sus dueños o prestadas corresponde a la estimación del pago (renta estimada o imputada), que es el precio que el encuestado considera que estaría pagando por un inmueble similar en el mercado, o bien, el importe que cobraría si este no lo estuviese habitando y lo rentara, o en el caso de las viviendas financiadas puede corresponder al pago por concepto de hipoteca.

En las gráficas 1 se muestra una comparación de la distribución de las rentas pagadas y las imputadas.

Se observa que estas son similares, solo se ven diferencias en la parte inferior de la distribución, en la que el importe de la imputada está por debajo del de renta, pero aproximadamente después del cuantil 0.25 son muy semejantes; es decir, se puede considerar que, para los niveles inferiores de la distribución, los dueños de los inmuebles subestiman de manera ligera[6] el valor en el que se podría rentar la propiedad con esas características en el mercado, lo cual no ocurre en la parte alta de la distribución. Más aún, las rentas imputadas enfrentan el sesgo de reflejar el valor de uso de quien la habita, que está determinado por la provisión del servicio de alojamiento, del acceso a condiciones para higiene personal o para la preparación de alimentos, razón por la que el valor asociado a la producción doméstica de estos servicios podría no necesariamente reflejar el valor de mercado del activo en renta.

 

RDE38_art05_graf01

Los datos de estas cinco ediciones de la ENIGH permiten también considerar diversas variables sobre las características de las viviendas, las cuales podemos agrupar en cuatro grupos: i) edificación de la vivienda (siete: material de techos, paredes y pisos; tipología de la vivienda; uso compartido; número de cuartos; antigüedad), ii) acceso a servicios (seis: disponibilidad de agua, agua en sanitario, drenaje, disponibilidad de electricidad, combustible, eliminación de basura), iii) equipamiento (13: cocina, fregadero, lavadero, regadera, tinaco, cisterna, pileta, calentador, medidor de luz, bomba de agua, tanque de gas, aire acondicionado, calefacción) y iv) ubicación (dos: entidad federativa y tamaño de localidad).

Debido a los cambios metodológicos a través de los años en cada edición de la Encuesta y a la presencia de datos faltantes, se tomaron las siguientes consideraciones:

  • Es necesario homologar las categorías contempladas en cada variable con el fin de hacerlas comparables entre sí. En el Anexo 1 se muestra un resumen de las variables de los grupos i, ii y iii arriba descritos; ahí se observan además las frecuencias de las categorías definidas para cada variable con base en los documentos metodológicos de cada edición de la ENIGH (2010, 2012, 2014, 2016 y 2018).
  • Con respecto a los datos faltantes, se identifica esta situación en particular para la variable de antigüedad, donde se tiene que hasta 15 % de las viviendas no cuentan con esta información. Dado que la ausencia de este dato no refleja cero años, y la antigüedad usualmente está asociada al mejoramiento del inmueble, se decide imputar los datos faltantes.[7]
  • Se imputan dichos registros de forma aleatoria a partir de un conjunto de posibles donadores con base en las variables relacionadas con la ubicación geográfica y tipo de vivienda.[8] En el Anexo 2 se muestran gráficas con el resultado de la imputación de la variable antigüedad.

Con respecto a las variables de ubicación geográfica, se tiene cobertura en las 32 entidades federativas y, además, se cuenta con información por tamaño de localidad.

En el cuadro se muestra un resumen de la distribución de las viviendas por tamaño de localidad.

 

RDE38_art05_cdr01

Indicador de Calidad de las Viviendas

Esta sección está basada en el artículo de Arévalo y Ruiz-Castillo (2006), en el que se realiza un ejercicio de estimación de precios hedónicos para el mercado español de vivienda con base en dos encuestas en hogares de los años 1980/1981 y 1990/1991, y se encuentra que el mercado de rentas puede ser bien representado por un índice de calidad de las viviendas, dos variables sobre la ubicación geográfica de las viviendas y el año de ocupación.

De esta manera, con la finalidad de estimar índices de precios de vivienda ajustados por la heterogeneidad de las viviendas se elaboró el ICV para sintetizar la mayor parte de la variabilidad asociada a las características de estas en un reducido número de variables. Dado que las características en las que se desea reducir dimensionalidad se observan en categorías (y no en un continúo numérico), se emplea la técnica MCA, la cual permite reducir múltiples variables categóricas en un reducido número al tiempo que se extrae la mayor variabilidad —ver Husson y Pagès (2017) o Tenenhaus y Young (1985) para una amplia explicación—; esta técnica es análoga a la de componentes principales para variables continuas.

De esta forma, al incorporar el ICV en sustitución de las 26 variables que lo componen (por ejemplo, en la regresión de precios hedónicos), se tiene un modelo parsimonioso que aprovecha al máximo la información de la ENIGH. Además, el Indicador permite capturar la interacción entre estas variables, con lo que, de otro modo, incrementaría considerablemente el número de variables dicotómicas adicionales, generando saturación del modelo, reduciendo el número de grados de libertad.

Para la construcción del ICV,[9] se consideran variables que están relacionadas con las características de edificación, acceso a servicios y equipamiento, y que se describen en el Anexo 1. Las relacionadas con la ubicación de la vivienda se consideran factores determinantes del precio de renta, por lo que estas, entidad federativa y tamaño de localidad no se incluyen en la construcción del Indicador, sino que se incorporan directamente en las diferentes metodologías de precios.

El porcentaje de inercia (varianza explicada) calculado con el criterio de Benzécri (1979) para la primera dimensión se ubica en 79.31, 79.04, 79.08, 76.79 y 76.86 para los cinco años de la Encuesta, mientras que para la segunda asciende a 3.48, 3.07, 2.85, 3.41 y 3.27, respectivamente. Estos porcentajes son razonablemente comparables con el trabajo de Arévalo y Ruiz-Castillo (2006), donde el porcentaje de inercia de los primeros dos factores es de 86.2 y 12.1, en ese orden, para la encuesta de 1980/1981, y 73.2 y 10.5 para la de 1990/1991, para los dos años de encuesta que ahí se estudian. En las gráficas 2 se muestra la relación entre cada una de las variables con las primeras dos dimensiones para la ENIGH 2018. Una interpretación geométrica de estos resultados es la siguiente: los n-datos de las viviendas en el p-espacio se pueden expresar en un nuevo conjunto de coordenadas, que coinciden con los ejes de la hiperelipsoide centrada en la vivienda con característica promedio, y cuyos ejes están dados, son los eigenvectores de la matriz de varianzas y covarianzas.

 RDE38_art05_graf02

Se puede apreciar que las variables agua en sanitario, regadera y disponibilidad de agua están más asociadas con la primera dimensión, mientras que las de agua en sanitario, acceso a drenaje y material en techos son las que más contribuyen a la segunda.

Además, al observar la distribución de las viviendas en el plano construido a partir de las dimensiones 1 y 2 para las variables más representativas mencionadas en el párrafo anterior, se puede identificar una clara separación entre las categorías asociadas dentro de cada variable. Más aún, se ve que se distribuyen siguiendo una estructura parabólica, que es conocida como efecto Guttman (Greenacre, 1991), el cual revela que, mientras el primer factor resume la estructura de todas las categorías, el segundo muestra una oposición entre categorías extremas (de baja frecuencia) y categorías promedio (alta frecuencia) de una variable. En las gráficas 3 se muestran las variables más representativas mencionadas en el párrafo anterior.

 

RDE38_art05_graf03

A partir de las gráficas 2, podemos identificar las características típicas de las viviendas: aquellas más alejadas del centro de gravedad (0,0) son las menos parecidas, mientras que las más cercanas a este son las que ocurren con mayor frecuencia. Con base en el análisis de los resultados, se elige la primera componente como reflejo de la calidad de la vivienda, ya que permite identificar qué características de los inmuebles producen mayor variabilidad y, con ello, diferenciar aquellos que se separan más respecto a una vivienda promedio.

Por último, en la gráfica 4 se muestra la densidad de los indicadores de calidad de las viviendas estimados para las cinco ediciones de la ENIGH (2010-2018).

 

RDE38_art05_graf04

Se puede observar que la estimación del Indicador de Calidad es consistente a través de las cinco ediciones de la Encuesta Nacional de Ingresos y Gastos de los Hogares, y genera un continuo que se puede asociar a la calidad de las viviendas, el cual permite capturar la información de las 26 variables categóricas con un total de 93 niveles en sus variables.

Resultados de índices de precios

Aquí se muestran gráficamente los índices elaborados bajo las metodologías descritas en la segunda sección. Se dan las variaciones porcentuales bienales por entidad y nacional, mientras que en los anexos 3, 4 y 5 se muestran cuadros con los índices de precios en niveles. Note que, al tratarse de índices, estos son útiles, principalmente, para hacer comparaciones temporales dentro de cada estado, y debe tenerse cuidado en hacerlas sobre la evolución de los índices entre las entidades, pues al estar las cifras normalizadas con respecto a su valor inicial no es válido afirmar que un estado ha crecido/decrecido más o menos que otro, sino que se puede decir que esa entidad ha crecido/decrecido más o menos que otra respecto al valor inicial de cada una de ellas, y no en términos absolutos.

Índice de Precios Hedónico

El modelo de precios hedónico incorpora las variables del ICV, entidad federativa y tamaño de localidad. Al incluir el ICV como variable en la regresión hedónica, el porcentaje de varianza explicada se ubica en 44.2, 43.9, 47.3, 46.1 y 48.0 para las cinco ediciones de la ENIGH, respectivamente. Esto compara de manera favorable con la alternativa de introducir en el modelo todas las variables, donde la varianza explicada se ubica alrededor de 41.4 % en promedio para las ediciones de la ENIGH consideradas. Además, las tres variables incluidas resultan significativas. Una vez que se obtienen los coeficientes de la regresión hedónica, se utiliza la mediana de las características promedio RDE38_art05_ft17 y se multiplica por los coeficientes de la regresión multiplicados, así se aprovecha toda la distribución disponible en la muestra que se pudiera perder al utilizar promedios RDE38_art05_ft18. A través del uso de la mediana se mitiga la problemática que surge ante la presencia de datos atípicos, que no se corrige al utilizar la media de los datos.

En las gráficas 5 se muestran las variaciones porcentuales de los índices de precios hedónicos calculados para las 32 entidades federativas.

Se observa de estas que los índices de precios (línea azul) muestran una dinámica más suavizada que los precios promedio (negra), es decir, los índices de precios hedónicos, al incorporar la información de las características de la vivienda reflejan de manera más fidedigna las variaciones en los precios de la vivienda en renta. Así, durante el periodo 2010-2018, el aumento promedio de estos para las 32 entidades federativas fue de 29.1 %, lo que implica un incremento medio anual de 2.6 por ciento.

 

RDE38_art05_graf05

Índice Estatificado de Precios

Para la elaboración de los índices estratificados de precios de renta se definieron cuatro estratos en función de las variables disponibles en la base de datos: i) año de la ENIGH, ii) entidad federativa, iii) cuantil del ICV (0-0.25, 0.25-0.5, 0.5-0.75, 0.75-1) y iv) tamaño de localidad (1 = menos de 2 500 hab., 2 = de 2 500 a 14 999 hab., 3 = de 15 000 a 99 999 hab., 4 = 100 000 y más hab.). Además, se utiliza la variable de tamaño de localidad para elaborar dos subíndices para localidades urbanas (con más de 2 500 hab.) y rurales (con menos de 2 500 hab.); y se calculan índices agregados a nivel nacional. Se utiliza el 2010 como año base para el cálculo de los ponderadores, los cuales se mantienen fijos en el cálculo de los índices de los siguientes años; dichos ponderadores se calculan utilizando los factores de expansión de la ENIGH.

En las gráficas 6 se muestra la evolución de las variaciones porcentuales a lo largo del tiempo de los diferentes índices de precios calculados para cada entidad federativa.

De las gráficas 6 podemos ver la variación de precios respecto a los del 2010. Esta metodología permite separar los resultados en localidades urbanas (línea roja) y rurales (azul), y el agregado de ambas (negra); así, podemos observar que la evolución de los precios total refleja primordialmente la dinámica de las localidades urbanas, ya que estas dos líneas se encuentran usualmente juntas. La variación en localidades rurales es más volátil que en las urbanas. Además, la variación promedio del periodo 2010-2018 para las 32 entidades federativas fue de 3.7 por ciento.

RDE38_art05_graf06

Índice Espacial de Precios

Utilizando la metodología PSM se parean las viviendas en cada entidad con respecto a un inmueble similar en la entidad control, en este caso el estado de México, y se hacen comparaciones de los precios a través del cálculo de índices. Se elige este ya que es una entidad con una amplia variedad de localidades rurales y urbanas. De esta forma, al calcular un índice por encima del 100 indica que, en promedio, los precios en la entidad de análisis están por encima del estado control y, viceversa, cuando están por debajo son, en promedio, inferiores a los de la entidad control.

En las gráficas 7 se muestran los índices para los cinco años en que se tiene información de la ENIGH (2010 a 2018).

 

 RDE38_art05_graf07

De las gráficas 7 podemos ver que se marca en color azul la entidad federativa de referencia (México) y el resto de los estados se muestra en orden descendiente respecto a dicha entidad. Destaca que los que en promedio observan precios por encima de la entidad control son Campeche (+18.9 %), Ciudad de México (+17.5 %), Quintana Roo (+15 %), Jalisco (+14.8 %) y Querétaro (+13.3 %); en ese mismo sentido, las entidades cuyos precios son más parecidos a la de control son Colima (+0.5 %), Veracruz de Ignacio de la Llave (+0.5 %), Nuevo León (-0.4 %) y Guerrero (-0.6 %); por su parte, Durango (-21.2 %), Tlaxcala (-19.2 %), Coahuila de Zaragoza (-19.2 %), Chihuahua (-18 %) y Zacatecas (-15.7 %) regularmente registran precios por debajo del estado de México. El resto de las entidades presenta precios que no muestran una consistencia regular superior o inferior a los de México.

Conclusiones

En esta investigación se cuantificaron las variaciones en el alquiler de vivienda en México por entidad federativa para el periodo 2010-2018; para ello, se utilizaron tres metodologías de índices de precios: Hedónico, Estratificado y Espacial. Se explotaron los datos de la ENIGH, de la cual se obtiene un amplio conjunto de variables sobre las características físicas, la ubicación y el acceso a servicios de las viviendas. La principal aportación del presente estudio es la elaboración del ICV, el cual resume en una sola variable entre 77 y 80 % de la variabilidad asociada a las características de las viviendas, y que se incorpora posteriormente para el cálculo de los índices de precios.

Es clara la ventaja de reducir la dimensionalidad de variables ya que al introducir esta en los modelos para construir los índices de precios se incorpora de manera eficiente la vasta información de las viviendas; es decir, es posible emplear variables subjetivas que reflejen una valoración del bien. Se podría utilizar, por ejemplo, la información de calificaciones asignadas por los usuarios para valorar viviendas o algún otro indicador que refleje la calidad de estas.

Las tres metodologías de índices de precios exploradas en este trabajo permiten abordar la problemática sobre la evolución de los precios de renta de vivienda en México desde diferentes perspectivas, ya sea ajustando por la calidad de los inmuebles o al separar por tamaños de localidad o emparejando viviendas en entidades federativas que pueden estar muy distantes. Los resultados de la investigación sugieren que, con base en el Índice de Precios Hedónico, el alquiler se ha incrementado alrededor de 2.6 % en promedio cada año entre el 2010 y 2018 a nivel nacional. Por otro lado, el Índice Estratificado de Precios permite separar las variaciones de precios con respecto al tamaño de localidad (urbana y rural); así, se puede ver que la evolución de los precios en localidades rurales ha sido más volátil que en las urbanas. Por último, a través del Índice Espacial de Precios, podemos comparar precios de viviendas iguales en dos entidades federativas para un año en particular, y así identificar en qué estados recurrentemente hay inmuebles con precios más elevados con respecto al estado de México (como Campeche, Ciudad de México y Quintana Roo) y en cuáles se tienen con precios inferiores a la entidad de referencia (como Durango, Tlaxcala y Coahuila de Zaragoza).

Los resultados de este trabajo pueden ser de utilidad para los encargados de políticas públicas, por ejemplo, para la asignación presupuestal de apoyos a la renta de vivienda considerando los diferenciales de precios ajustados por la calidad de las viviendas. Por otro lado, pueden servir de referencia para futuras investigaciones sobre alquiler que cuenten con bases de datos de mayor frecuencia, para lo cual se podrían emplear herramientas de web scrapping de sitios de bienes raíces en internet. Las limitaciones del presente estudio son, principalmente, la disponibilidad temporal de información, ya que la ENIGH se encuentra disponible en forma bienal entre 2010 y 2018, por lo que no hay datos para los años intermedios; se podría explorar la incorporación de otras fuentes, como la Encuesta Nacional de los Hogares (aunque solo se tiene para los años 2014, 2015, 2016 y 2017).

______________

Fuentes

Arévalo, R. y J. Ruiz-Castillo. “On the imputation of rental prices to owner-occupied housing”, en: Journal of the European Economic Association. 4(4), 2006, pp. 830-861.

Benzécri, J. P. “Sur le calcul des taux d’inertie dans l’analyse d’un questionnaire. Addendum et erratum”, en: Cahiers de l’Analyse des Données. 4, 1979, pp. 377-378.

Bergman, P., R. Chetty, S. DeLuca, N. Hendren, L. F. Katz y C. Palmer. Creating moves to opportunity: Experimental evidence on barriers to neighborhood choice. Working Paper No. 26164. National Bureau of Economic Research, 2019.

Eurostat. Handbook on Residential Property Prices Indices (RPPIs). Bélgica, Comisión Europea, 2013.

Galvis, L. y B. Carrillo. “Índice de precios espacial para la vivienda urbana en Colombia: una aplicación con métodos de emparejamiento”, en: Revista de Economía del Rosario. 16(1), 2013, pp. 25-59.

Greenacre, M. “Interpreting Multiple Correspondence Analysis”, en: Applied Stochastic Models and Data Analysis. 7, 1991, pp. 195-210.

Ho, D., K. Imai, G. King, & E. Stuart. “MatchIt: Nonparametric Preprocessing for Parametric Causal Inference”, en: Journal of Statistical Software. Vol. 42, Núm. 8, 2011, pp. 1-28.

Husson, F., S. Lê y J. Pagès. Exploratory multivariate analysis by example using R. CRC press, 2017.

INEGI. Índice Nacional de Precios al Consumidor. Documento metodológico: base segunda quincena de julio del 2018. Aguascalientes, México, INEGI, 2018.

_______ Nueva construcción de la Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) 2010: Descripción de la base de datos. Aguascalientes, México, INEGI, 2011.

_______ Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) 2012: Descripción de la base de datos de la nueva construcción de variables. Aguascalientes, México, INEGI, 2013.

_______ Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) 2014: Descripción de la base de datos. Nueva construcción de variables. Aguascalientes, México, INEGI, 2015.

_______ Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) 2016: Nueva serie, descripción de la base de datos. Aguascalientes, México, INEGI, 2017.

_______ Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) 2018: Nueva serie, descripción de la base de datos. Aguascalientes, México, INEGI, 2019.

Lancaster, K. “A new approach to consumer theory”, en: Journal of Political Economy. 74(2), 1966, pp. 132-157.

ONU-Habitat e INFONAVIT. Vivienda y ODS en México. 2018.

Rosen, S. “Hedonic prices and implicit markets: product differentiation in pure competition”, en: Journal of Political Economy. 82(1), 1974, pp. 34-55.

Rosenbaum, P. R. y D. R. Rubin. “The Central Role of the Propensity Score in Observational Studies for Causal Effects”, en: Biometrika. 70(1), 1983, pp. 41-55.

Rubin, D. “Multivariate Matching Methods that are Equal Percent Bias Reducing, I: Some Examples Biometrics”, en: Biometrics. 32(1), 1976, pp. 109-120.

Secretaría de Desarrollo Agrario, Territorial y Urbano (SEDATU). Programa Nacional de Vivienda 2019-2024. México, SEDATU, 2019.

Sociedad Hipotecaria Federal (SHF). Índice SHF de Precios de Vivienda. México, SHF, 2020.

Silver, M. “Real-Estate Price Indexes. Availability, Importance, and New Developments”, en: Realidad, Datos y Espacio Revista Internacional de Estadística y Geografía. 7(1), 2016, pp. 4-25.

Tenenhaus, M. y F. W. Young. “An analysis and synthesis of multiple correspondence analysis, optimal scaling, dual scaling, homogeneity analysis and other methods for quantifying categorical multivariate data”, en: Psychometrika. 50(1), 1985, pp. 91-119.

Zamudio, F. J., M. A. Andrade y G. Becerril. “Un sistema integral de indicadores de vivienda para México”, en: Realidad, Datos y Espacio Revista Internacional de Estadística y Geografía. 11(2), 2020, pp. 36-51.

 

Anexos

RDE38_art05_anx01-a

 

RDE38_art05_anx01-b

RDE38_art05_anx01-c

RDE38_art05_anx01-d

RDE38_art05_anx01-e

RDE38_art05_anx02

RDE38_art05_anx03-a

RDE38_art05_anx03-b

RDE38_art05_anx04-a

RDE38_art05_anx04-b

RDE38_art05_anx05-a

RDE38_art05_anx05-b

[1] Programa estadístico del Instituto Nacional de Estadística y Geografía (INEGI).

[2] OECD. Affordable Housing Databasehttp://oe.cd/ahd

[3] Sistema Nacional de Información e Indicadores de Vivienda (SNIIV), https://sniiv.sedatu.gob.mx/Dashboard/Inicio

[4] Programa estadístico del INEGI.

[5] La implementación se realiza en el programa R utilizando la librería matchit (Ho, Imai, King, & Stuart, 2011).

[6] Entre 3.6 y 6 % para el percentil 5 y entre 2.8 y 5.1 % para el 10.

[7] La alternativa es dejar fuera esos registros, sin embargo, esto podría generar desbalances en los estratos de la Encuesta, por lo que los resultados no serían consistentes a nivel entidad federativa.

[8] Se utiliza la función match impute de la librería VIM del paquete R.

[9] La estimación del MCA se realiza a través de la librería FactoMineR del paquete R.

 

Un comentario

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *