Aprendizaje automático aplicado a la estimación de información demográfica a partir de imágenes satelitales / Machine learning applied to the estimation of demographic information from satellite images

Aramayo, Martín G. (2021) Aprendizaje automático aplicado a la estimación de información demográfica a partir de imágenes satelitales / Machine learning applied to the estimation of demographic information from satellite images. Maestría en Ciencias Físicas, Universidad Nacional de Cuyo, Instituto Balseiro.

[img]
Vista previa
PDF (Tesis)
Disponible bajo licencia Creative Commons: Reconocimiento - No comercial - Compartir igual.

Español
6Mb

Resumen en español

La demografía es un campo de vital importancia para informar a organismos de toma de decisiones. La puesta en marcha de inversiones privadas, la formulación de políticas públicas y los presupuestos para objetivos gubernamentales, pueden cambiar drásticamente según el número de personas en distintos grupos demográficos. Los resultados de un análisis demográfico son cruciales, por ejemplo, para planificar campañas de vacunación. Desde UNICEF, se busca realizar una de estas campañas en países en desarrollo con el objetivo de aumentar calidad y expectativa de vida en sus habitantes. Con el objetivo de colaborar en estos esfuerzos, se construyó un estimador demográfico para algunos distritos objetivo de UNICEF en la Rep. de Chad que utiliza la técnica bottom up. El estimador emplea información satelital y microcensos para estimar el número de personas en subpoblaciones objetivo usando técnicas estadísticas y de aprendizaje automático. Esa técnica permite tener una estimación de la población de un distrito a una fracción del costo y de la complejidad logística de un censo nacional. Se utilizaron los datos de la condición y el número de habitantes de una vivienda para realizar la estimación de los tamaños de subpoblaciones. La importancia de estas variables en el trabajo motivaron un estudio más profundo de sus propiedades. Con esto en mente, se implementó un modelo basado en agentes con recursos finitos que consideraba a las viviendas como el recurso limitante, el modelo pretende capturar aspectos de la dinámica de poblaciones humanas. El modelo de agentes de este trabajo presenta oscilaciones en el número de habitantes y puede simular la extinción de una población. Está diseñado además para obtener a cada instante pirámides poblacionales y distribuciones de tamaño de vivienda, las cuales replican cualitativamente en forma y dinámica las observadas en las poblaciones de algunos países. En particular, las simulaciones con oscilaciones parecen replicar etapas del modelo demográfico de transición. Se encontró además que el modelo es similar en comportamiento y dinámica al modelo poblacional logístico con retraso. Finalmente se observó, para un rango de parámetros, una correlación existente en poblaciones humanas entre el tamaño de vivienda y la natalidad. Los resultados abren nuevas líneas de investigación, tanto para refinar la estimación de subpoblaciones a partir de datos satelitales, como para expandir la dinámica actual del modelo, agregando parámetros que puedan variar en el tiempo o variando la cantidad de viviendas disponibles.

Tipo de objeto:Tesis (Maestría en Ciencias Físicas)
Palabras Clave:Statistics; Estadística; Demography; Demografía; Machine learning; Aprendizaje automático; [Agent based simulation; Simulación basada en agentes; Satellite data; Datos satelitales; Binary classification; Clasificación binaria ]
Referencias:[1] O’Hare, W. P. The importance of census accuracy: Uses of census data, 2019. URL https://doi.org/10.1007/978-3-030-10973-8_2. [2] Grove, J., Claeson, M., Bryce, J., Amouzou, A., Boerma, T.,Waiswa, P., et al. Maternal, newborn, and child health and the sustainable development goals—a call for sustained and improved measurement. The Lancet, 386 (10003), 1511–1514, oct. 2015. doi:10.1016/s0140-6736(15)00517-6. URL https://doi.org/10.1016/s0140-6736(15)00517-6. [3] Office, U. N. S. Principles and recommendations for population and housing censuses. 67. New York: United Nations, Department of International Economic and Social Affairs Statistics Division, 1980. [4] UNFPA. Technical brief on the implications of COVID-19 on census (pdf), 2020. [5] DesRoches, R., Comerio, M., Eberhard, M., Mooney, W., Rix, G. J. Overview of the 2010 Haiti earthquake. Earthquake Spectra, 27, 1–21, oct. 2011. doi:10.1193/1.3630129. URL https://doi.org/10.1193/1.3630129. [6] Haiti rolls out its first census survey since the 2010 earthquake. URL https://www.worldbank.org/en/news/feature/2017/12/15/ haiti-rolls-out-its-first-census-survey-since-the-2010-earthquake, accesed: 2021- 02-12. [7] Chad | History, Flag, Map, & Facts. URL https://www.britannica.com/place/Chad. [8] Chad - The World Factbook. URL https://www.cia.gov/the-world-factbook/countries/ chad/#transportation, publisher: CIA. [9] Weber, E. M., Seaman, V. Y., Stewart, R. N., Bird, T. J., Tatem, A. J., McKee, J. J., et al. Census-independent population mapping in northern Nigeria. Remote Sensing of Environment, 204, 786–798, ene. 2018. doi:10.1016/j.rse.2017.09.024. URL https://doi.org/10.1016/j.rse. 2017.09.024. [10] Wardrop, N., Jochem, W., Bird, T., Chamberlain, H., Clarke, D., Kerr, D., et al. Spatially disaggregated population estimates in the absence of national population and housing census data. Proceedings of the National Academy of Sciences, 115 (14), 3529–3537, 2018. [11] Stehman, S. V. Selecting and interpreting measures of thematic classification accuracy. Remote Sensing of Environment, 62 (1), 77–89, oct. 1997. doi:10.1016/s0034-4257(97)00083-7. URL https://doi.org/10.1016/s0034-4257(97)00083-7. [12] Chard, T. Pregnancy tests: a review. Human Reproduction, 7 (5), 701–710, mayo 1992. doi:10.1093/oxfordjournals.humrep.a137722. URL https://doi.org/10.1093/oxfordjournals.humrep.a137722. [13] Hoo, Z. H., Candlish, J., Teare, D. What is an ROC curve? Emergency Medicine Journal, 34 (6), 357–359, mar. 2017. doi:10.1136/emermed-2017-206735. URL https://doi.org/10. 1136/emermed-2017-206735. [14] Saito, T. The precision-recall plot is more informative than the ROC plot when evaluating binary classifiers on imbalanced datasets, 2014. URL https://figshare.com/articles/dataset/ The_Precision_Recall_plot_is_more_informative_than_the_ROC_plot_when_evaluating_ binary_classifiers_on_imbalanced_datasets/1245061. [15] Weeks, J. Population, pág. 216. Wadsworth Publishing, 2020. 13ra. edición. [16] Daugherty, H., Kammeyer, K. An Introduction to Population. Guilford Publications, 1995. [17] E, E.-B., A, A.-M. The economic impact of immigration on host countries: the case of Saudi Arabia. Proceedings of Middle East Economic Association, 20 (1), 69–84, mayo 2018. [18] Max Roser, H. R., Ortiz-Ospina, E. World population growth. Our World in Data, 2013. Https://ourworldindata.org/world-population-growth. [19] Kirk, D. Demographic transition theory. Population Studies, 50 (3), 361–387, nov. 1996. doi:10.1080/0032472031000149536. URL https://doi.org/10.1080/0032472031000149536. [20] Myrskylä, M., Kohler, H.-P., Billari, F. C. Advances in development reverse fertility declines. Nature, 460 (7256), 741–743, ago. 2009. doi:10.1038/nature08230. URL https://doi.org/10. 1038/nature08230. [21] Weeks, J. Population, pág. 126. Wadsworth Publishing, 2020. 3ra. edición. [22] Díaz-Briquets, S. Accounting for recent fertility swings in Cuba. Population and Development Review, 40 (4), 677–693, dic. 2014. doi:10.1111/j.1728-4457.2014.00006.x. URL https://doi.org/10.1111/j.1728-4457.2014.00006.x. [23] Yip, P. S., Lee, J., Cheung, Y. The influence of the chinese zodiac on fertility in Hong Kong SAR. Social Science & Medicine, 55 (10), 1803–1812, nov. 2002. doi:10.1016/s0277-9536(01)00312-4. URL https://doi.org/10.1016/s0277-9536(01)00312-4. [24] Jennings, V., Lloyd-Smith, B., Ironmonger, D. Household size and the Poisson distribution. Journal of the Australian Population Association, 16 (1-2), 65–84, mayo 1999. doi:10.1007/bf03029455. URL https://doi.org/10.1007/bf03029455. [25] Zeng, Y., Land, K. C., Gu, D. Household and Living Arrangement Projections. The Springer Series on Demographic Methods and Population Analysis. New York, NY: Springer, 2013. [26] Households by age and sex of reference person and by size of household. URL http://data.un. org/Data.aspxq=household+size&d=POP&f=tableCode%3a50#POP. [27] Grimm, V., Railsback, S. F. Individual-based modeling and ecology. Princeton Series in Theoretical and Computational Biology. Princeton, NJ: Princeton University Press, 2005. [28] Grow, A., Van Bavel, J. (eds.) Agent-based modelling in population studies. The Springer Series on Demographic Methods and Population Analysis. Basel, Switzerland: Springer International Publishing, 2016. 1ra. edición. [29] Colchero, F., Rau, R., Jones, O. R., Barthold, J. A., Conde, D. A., Lenart, A., et al. The emergence of longevous populations. Proceedings of the National Academy of Sciences, 113 (48), E7681–E7690, nov. 2016. doi:10.1073/pnas.1612191113. URL https://doi.org/10.1073/pnas. 1612191113. [30] Scheuerlein, A., Leek, S. Individual lifespans are becoming more similar. URL https://www.demogr.mpg.de/mediacms/5410_main_MPIDR-PR_lifespans_becoming%20_ more_similar_EN.pdf, visitado el 11-12-2021. [31] Putri, A., Mukhtar, M. K., Widyastuti, R., Manessa, M. D. M., et al. The relationship between night time light and population in 2000 and 2015 in the Java Island. En: IOP Conference Series: Earth and Environmental Science, tomo 500, pág. 012068. IOP Publishing, 2020. [32] Mcfeeters, S. K. The use of the normalized difference water index (NDWI) in the delineation of open water features. International Journal of Remote Sensing, 17 (7), 1425–1432, mayo 1996. doi:10.1080/01431169608948714. URL https://doi.org/10.1080/01431169608948714. [33] Pettorelli, N., Vik, J. O., Mysterud, A., Gaillard, J.-M., Tucker, C. J., Stenseth, N. C. Using the satellite-derived NDVI to assess ecological responses to environmental change. Trends in Ecology & Evolution, 20 (9), 503–510, sep. 2005. doi:10.1016/j.tree.2005.05.011. URL https: //doi.org/10.1016/j.tree.2005.05.011. [34] Jennings, V. E., Lloyd-Smith, C. W. Poisson and household size. Mathematical Scientist, 40 (2), 103 – 117, 2015. URL http://search.ebscohost.com/login.aspx?direct=true&db=aph&AN=112019827&lang=es&site=ehost-live. [35] Johnson Norman, L., Kemp Adrienne, W. Kotz Samuel univariate discrete distributions. 3, 2005. [36] Cohen, A. C. Estimating the parameter in a conditional Poisson distribution. Biometrics, 16 (2),203–211, 1960. [37] Makridakis, S. Accuracy measures: theoretical and practical concerns. International Journal of Forecasting, 9 (4), 527–529, dic. 1993. doi:10.1016/0169-2070(93)90079-3. URL https://doi.org/10.1016/0169-2070(93)90079-3. [38] Devroye, L. Non-uniform random variate generation. New York: Springer-Verlag, 1986. [39] The Pandas development team. pandas-dev/pandas: Pandas, feb. 2020. URL https://doi.org/10.5281/zenodo.3509134. [40] Harris, C. R., Millman, K. J., van der Walt, S. J., Gommers, R., Virtanen, P., Cournapeau, D., et al. Array programming with NumPy. Nature, 585, 357–362, 2020. doi:10.1038/s41586-020-2649-2. [41] Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., et al. Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825–2830, 2011. [42] Virtanen, P., Gommers, R., Oliphant, T. E., Haberland, M., Reddy, T., Cournapeau, D., et al. SciPy 1.0: Fundamental Algorithms for Scientific Computing in Python. Nature Methods, 17, 261–272, 2020. doi:10.1038/s41592-019-0686-2. [43] Zhou, Z.-H. Ensemble methods: foundations and algorithms. CRC press, 2012. [44] Ying, C., Qi-Guang, M., Jia-Chen, L., Lin, G. Advance and prospects of adaboost algorithm. Acta Automatica Sinica, 39 (6), 745–758, 2013. [45] Chen, T., Guestrin, C. XGBoost: A scalable tree boosting system. ACM, págs. 785–794, 2016. doi:10.1145/2939672.2939785. URL http://doi.acm.org/10.1145/2939672.2939785. [46] Murray, J. D. Mathematical Biology. Interdisciplinary applied mathematics. New York, NY: Springer, 2002. 3ra. edición.
Materias:Ciencias sociales > Demografía
Ciencias sociales > Estadística e indicadores sociales
Divisiones:Gcia. de área de Investigación y aplicaciones no nucleares > Gcia. de Física > Sistemas complejos y altas energías > Física estadística interdisciplinaria
Código ID:1059
Depositado Por:Tamara Cárcamo
Depositado En:08 Jul 2022 11:29
Última Modificación:08 Jul 2022 11:54

Personal del repositorio solamente: página de control del documento