Paradata analysis of the 2010 Population Census: investigation of factors associated with nonsampling errors in the data collection stage

Authors

  • Luciano Tavares Duarte Instituto Brasileiro de Geografia e Estatística
  • Denise Britz do Nascimento Silva ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS – ENCE
  • Jose Andre de Moura Brito ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS – ENCE

DOI:

https://doi.org/10.20947/S0102-30982016c0011

Keywords:

Brazilian Population Census. Paradata. Hierarchical models. Nonsampling errors.

Abstract

The relevance of a population census for a national statistical system is undeniable for its thematic and territorial coverage. Nonetheless, the complexity and size of a census operation lead to challenges for ensuring timeliness and quality of the results. This paper presents potential factors associated with non sampling errors detected in the data collection stage based on the analysis of Brazilian 2010 Population Census microdata and paradata. Data obtained from the field work monitoring system, called paradata, is used to provide information about divergences observed between data collected by enumerators and supervisors, also it is used the census microdata. The latter carried out follow-up interviews in households selected by the supervision/monitoring plan. Human resources databases containing socio-demographic information of enumerators and supervisors is also brought to enhance the analysis. The statistical modeling utilized is generalized hierarchical models, in which the response variable is defined as the occurrence of a discrepancy (or divergence) between the information collected by enumerators and their supervisors. The results indicate that the different hierarchical levels investigated are relevant to decompose data variability and hence have to be considered in the analysis. However, respondents’ characteristics have markedly more influence on the chances of a divergence than those of enumerators’ and supervisors’. In addition, there is evidence that respondents who are male, illiterate (or with low educational level), older and living in households with indicators reflecting poor life conditions present higher odds in favor of the occurrence of divergences on data collected by enumerator and supervisor.

Downloads

Download data is not yet available.

Author Biographies

Luciano Tavares Duarte, Instituto Brasileiro de Geografia e Estatística

Possui graduação em Estatística pela Escola Nacional de Ciências Estatísticas (1997) e mestrado em Estudos Populacionais e Pesquisas Sociais pela ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS (2014). Atualmente é tecnologista de inf. geog. e estatísticas da Fundação Instituto Brasileiro de Geografia e Estatística. Tem experiência na área de Estatísticas Públicas, com ênfase em Qualidade das Estatísticas Populacionais, atuando principalmente nos seguintes temas: Métodos de Controle da Qualidade na Produção de Estatísticas Populacionais, Modelos Hierárquicos e Paradados.

Denise Britz do Nascimento Silva, ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS – ENCE

Possui graduação em Estatística pela Escola Nacional de Ciências Estatísticas (1985), mestrado em Estatística pela Universidade Federal do Rio de Janeiro (1992) e doutorado em Estatística pela University of Southampton (1996). Atualmente é pesquisadora da Fundação Instituto Brasileiro de Geografia e Estatística onde atua como Coordenadora da Coordenação de Treinamento e Aperfeiçoamento e pesquisadora da Escola Nacional de Ciências Estatísticas. É vice-presidente do Instituto Interamericano de Estatística e secretária científica da International Association of Survey Statisticians. Tem experiência na área de Probabilidade e Estatística, com ênfase em Probabilidade e Estatística Aplicadas, atuando principalmente nos seguintes temas: análise de dados amostrais, estimação em pequenas áreas/domínios, modelagem estatística e análise de séries temporais de pesquisas amostrais.

Jose Andre de Moura Brito, ESCOLA NACIONAL DE CIÊNCIAS ESTATÍSTICAS – ENCE

Tem bacharelado em Matemática pela Universidade Federal do Rio de Janeiro (1997), Mestrado em Engenharia de Sistemas e Computação (Otimização) pela Universidade Federal do Rio de Janeiro (1999), Doutorado em Engenharia de Sistemas e Computação (Otimização) pela Universidade Federal do Rio de Janeiro (2004) e Pós-Doutorado em Otimização na Universidade Federal Fluminense (2008). Atualmente é professor da Escola Nacional de Ciências e Estatística (ENCE/IBGE), onde leciona disciplinas na graduação e no mestrado. Também é editor associado e editor executivo da Revista Brasileira de Estatística (RBE). Tem experiência nas áreas de Otimização, Estatística e Computação, atuando principalmente nos seguintes temas: Metaheurísticas, Programação Inteira, Otimização Combinatória, Programação Não Diferenciável e Suavização, Análise de Algoritmos, Análise de Agrupamentos e Amostragem.

Published

2016-12-31

How to Cite

Duarte, L. T., Silva, D. B. do N., & Brito, J. A. de M. (2016). Paradata analysis of the 2010 Population Census: investigation of factors associated with nonsampling errors in the data collection stage. Brazilian Journal of Population Studies, 33(3), 679–701. https://doi.org/10.20947/S0102-30982016c0011

Issue

Section

Original Articles