Este segundo número de 2022 de Realidad, Datos y Espacio Revista Internacional de Estadística y Geografía está conformado por los siguientes artículos. A continuación, se describe su contenido.


Modelo de estimación del impacto del INEGI en la investigación y divulgación científica
(Model for Estimating INEGI’s Impact on Scientific Research and Dissemination). Este trabajo propone una metodología de medición en el contexto científico que considera indicadores bibliométricos y altmétricos. Para ello, se realizó la identificación de fuentes de información científica, recuperación de esta en publicaciones y perfiles de autores en redes sociales, así como la estandarización de los datos obtenidos. Se validó la métrica empleando un subconjunto de datos representativos y se detectó que los resultados pueden ser equiparables; se aplicó al periodo 1984-2018, observándose notables incrementos en el peso de las consultas al Instituto Nacional de Estadística y Geografía (INEGI) en cada uno de los últimos tres lapsos sexenales (20, 32 y 40 %, respectivamente). Se considera que a futuro pueden generarse modelos predictivos del impacto por áreas del conocimiento que maneja el Instituto, como la económica y sociodemográfica; de gobierno, seguridad pública e impartición de justicia; geográfica; medio ambiente; así como de ordenamiento territorial y urbano.

 

Caracterización del sesgo de selección en redes sociales en México a través de algunas características sociodemográficas de sus usuarios (Characterization of Selection Bias in Social Networks in Mexico through Some Sociodemographic Characteristics of their Users). Desde unos años atrás se ha considerado que los textos publicados en los medios de comunicación en la web representan una oportunidad para producir información oficial, por lo que varias oficinas nacionales de estadística han experimentado con su uso. Dado que es necesario saber si los usuarios de estos muestran diferencias importantes con la población general de México, según variables sociodemográficas relevantes que garanticen la comparabilidad, en esta investigación se propone llevar a cabo la cuantificación de tales discrepancias utilizando datos de la Encuesta Nacional sobre Disponibilidad y Uso de Tecnologías de la Información en los Hogares (ENDUTIH), ediciones 2017-2019, del INEGI.

 

Contribución del sistema financiero al crecimiento económico de México: un análisis econométrico, 1997-2019 (Contribution of the Financial System to Mexico’s Economic Growth: An Econometric Assessment, 1997-2019). Este trabajo contribuye a la discusión sobre el papel que tiene el conjunto de agentes económicos en el desarrollo nacional utilizando una novedosa aplicación empírica para el caso de México. El análisis de factores dinámicos permite concluir que los factores estimados representan de manera consistente, en sentido estadístico y económico, la evolución del sistema financiero en el país. Los resultados apoyan también la hipótesis de que este es especialmente relevante en un contexto de recuperación económica.

 

Evaluación de técnicas de procesamiento de lenguaje natural y Machine Learning para los procesos de codificación de encuestas en hogares (Evaluation of Natural Language Processing and Machine Learning Techniques for Household Survey Coding Processes). El artículo tiene por objetivo valorar el uso e incorporación de técnicas de inteligencia artificial y aprendizaje automático (NLP y ML, por sus siglas inglés, respectivamente) para incrementar el porcentaje de registros clasificados de manera automatizada. Para ello, se consideraron las variables de ocupación y actividad económica de la Encuesta Nacional de Ingresos y Gastos de los Hogares 2018. Los resultados obtenidos muestran que sería posible trasladar 50 % de los registros que actualmente se codifican con asistencia humana hacia un proceso de codificación con algoritmos de NLP y ML.

 

Imputation of Non-Response in Height and Weight in the “Mexican Health and Aging Study” (Imputación de no-respuesta en peso y talla en el Estudio Nacional de Salud y Envejecimiento). El propósito de este trabajo es explicar las razones y el procedimiento de imputación de datos antropométricos autorreportados en las primeras cuatro rondas de ese programa estadístico del INEGI. Se destaca el efecto de esta frente a la eliminación de los casos con datos faltantes, comparando la distribución de dichos valores y sus efectos asociados con el Índice de Masa Corporal mediante un modelo de regresión. Se concluye que la incorporación de datos imputados ofrece resultados más sólidos en comparación con la omisión de situaciones con información faltante. De ahí la importancia de aplicar estos procedimientos estadísticos con un manejo adecuado de los datos y difundir la metodología aplicada para obtener los datos imputados desde la misma fuente de información, tal como se ofrece en dicho estudio.

 

Hoja de ruta para producir frecuentemente información estadística representativa mediante el uso conjunto de información de redes sociales y encuestas (Roadmap for Frequently Producing Representative Statistical Information through the Joint Use of Social Networking and Survey Data). Este documento muestra una propuesta metodológica para que las oficinas nacionales de estadística generen información característica sobre múltiples temas, con mayor regularidad, utilizando en conjunto datos de entrevistas en hogares y publicaciones en los medios de comunicación de la web. El estudio se basa en dar un nuevo rol a los datos como insumo para el entrenamiento de algoritmos de aprendizaje automático. Para que esto funcione, las respuestas de los usuarios-informantes deben ser vinculadas. Un futuro levantamiento de la ENDUTIH del INEGI se empleará para estudiar la viabilidad de la propuesta, puesto que esta ya investiga el uso de las redes sociales y recopila información sociodemográfica.

 

Propuesta de indicadores alternativos para medir la confianza del consumidor (Proposed Alternative Indicators for Measuring Consumer Confidence). En este trabajo se presentan sugerencias para mejorar la correlación del Indicador de Confianza del Consumidor (ICC) con variables relevantes de la situación económica actual, como la actividad económica y el consumo privado. A partir de las 15 preguntas que produce la Encuesta Nacional sobre Confianza del Consumidor (ENCO) del INEGI y adicionalmente de indicadores de fuentes no tradicionales, específicamente de Google Trends, se estimaron ICC alternativos al actual.

 

Esperanza de vida sin limitaciones físicas ni mentales en México (Life Expectancy without Physical or Mental Limitations in Mexico). En esta investigación se presentan estimaciones producto de la aplicación del método de Sullivan en tablas de vida periodo construidas directamente con información censal y estadísticas de mortalidad. Es una propuesta original para el uso inmediato de los datos que produce y concentra el INEGI, que considera la diversidad nacional según sexo y entidad de residencia en el diseño de este indicador sintético de salud, que refleja la calidad de vida y no solo la expectativa de su duración. La autora sugiere que es necesario continuar aprovechando la información longitudinal que produce el Instituto para refinar los indicadores en esta materia.

 

Lecturas en lo que indican los indicadores (Readings in What Economic Indicators Indicate) es la reseña de una obra que actualiza y expande el material contenido en el libro Lo que indican los indicadores. Cómo utilizar la información estadística para entender la realidad económica de México, editado, publicado y difundido por el INEGI hace 10 años. Esta nueva publicación es el producto de la excelente coordinación del trabajo de 33 autores que abordan distintos temas y formas sobre cómo explicar y entender los indicadores para analizar y entender la coyuntura económica de nuestro país.

 

http://rde.inegi.org.mx