Under-reporting of COVID-19 in the Northern Health Authority region of British Columbia

Can J Stat. 2021 Dec;49(4):1018-1038. doi: 10.1002/cjs.11664. Epub 2021 Nov 1.

Abstract

Asymptomatic and pauci-symptomatic presentations of COVID-19 along with restrictive testing protocols result in undetected COVID-19 cases. Estimating undetected cases is crucial to understanding the true severity of the outbreak. We introduce a new hierarchical disease dynamics model based on the N-mixtures hidden population framework. The new models make use of three sets of disease count data per region: reported cases, recoveries and deaths. Treating the first two as under-counted through binomial thinning, we model the true population state at each time point by partitioning the diseased population into the active, recovered and died categories. Both domestic spread and imported cases are considered. These models are applied to estimate the level of under-reporting of COVID-19 in the Northern Health Authority region of British Columbia, Canada, during 30 weeks of the provincial recovery plan. Parameter covariates are easily implemented and used to improve model estimates. We compare two distinct methods of model-fitting for this case study: (1) maximum likelihood estimation, and (2) Bayesian Markov chain Monte Carlo. The two methods agreed exactly in their estimates of under-reporting rate. When accounting for changes in weekly testing volumes, we found under-reporting rates varying from 60.2% to 84.2%.

Le recours à des protocoles de tests restrictifs et l'existence de formes asymptomatiques et paucisymptomatiques de la COVID‐19 contribuent à la non détection de cas COVID‐19. Pour comprendre la véritable gravité de l'épidémie, il est primordial d'estimer correctement le nombre de cas non détectés. A cette fin, les auteurs de ce travail proposent un nouveau modèle hiérarchique des dynamiques de la maladie basé sur l'approche de N‐mélanges de population cachée. Ces modèles utilisent trois types de données régionales, à savoir, les nombres de cas déclarés, guéris et décédés. En faisant appel à l'amincissement binomial (binomial thinning) et en traitant les nombres de cas déclarés et guéris comme étant sous‐évalués, les auteurs proposent une modélisation de l'état réel de l'épidémie basée sur une partition de la population malade en trois catégories : cas actifs, cas guéris et cas décédés. Cette partition tient compte des cas de propagation intérieure et des cas importés. Les auteurs ont utilisé les données recueillies durant les trente semaines du plan de rétablissement provincial de la région de l'Autorité sanitaire du Nord de la Colombie‐Britannique, Canada pour illustrer leur approche et estimer le niveau de sous‐déclaration COVID‐19 associé. Des covariables peuvent être facilement incorporées au modèle proposé et améliorer la qualité des estimations. Deux méthodes d'ajustement sont retenues: (1) l'estimation par maximum de vraisemblance, et (2) la méthode de Monte Carlo par chaînes de Markov. Les estimations du taux de sous‐déclaration obtenues par ces deux méthodes concordent exactement et varient entre 60,2% et 84,2% après ajustement des variations des volumes de tests hebdomadaires.

Keywords: COVID‐19; MCMC; N‐mixtures; disease analytics; under‐reporting.