Background: Chronic kidney disease (CKD) is a major health issue and cardiovascular risk factor. Validity assessment of administrative data for the detection of CKD in research for drug benefit and risk using real-world data is important. Existing algorithms have limitations and we need to develop new algorithms using administrative data, giving the importance of drug benefit/risk ratio in real world.
Objective: The aim of this study was to validate a predictive algorithm for CKD GFR category 4-5 (eGFR < 30 mL/min/1.73 m2 but not receiving dialysis or CKD G4-5ND) using the administrative databases of the province of Quebec relative to estimated glomerular filtration rate (eGFR) as a reference standard.
Design: This is a retrospective cohort study using chart collection and administrative databases.
Setting: The study was conducted in a community outpatient medical clinic and pre-dialysis outpatient clinic in downtown Montreal and rural area.
Patients: Patient medical files with at least 2 serum creatinine measures (up to 1 year apart) between September 1, 2013, and June 30, 2015, were reviewed consecutively (going back in time from the day we started the study). We excluded patients with end-stage renal disease on dialysis. The study was started in September 2013.
Measurement: Glomerular filtration rate was estimated using the CKD Epidemiological Collaboration (CKD-EPI) from each patient's file. Several algorithms were developed using 3 administrative databases with different combinations of physician claims (diagnostics and number of visits) and hospital discharge data in the 5 years prior to the cohort entry, as well as specific drug use and medical intervention in preparation for dialysis in the 2 years prior to the cohort entry.
Methods: Chart data were used to assess eGFR. The validity of various algorithms for detection of CKD groups was assessed with sensitivity, specificity, positive predictive value (PPV), and negative predictive value (NPV).
Results: A total of 434 medical files were reviewed; mean age of patients was 74.2 ± 10.6 years, and 83% were older than 65 years. Sensitivity of algorithm #3 (diagnosis within 2-5 years and/or specific drug use within 2 years and nephrologist visit ≥4 within 2-5 years) in identification of CKD G4-5ND ranged from 82.5% to 89.0%, specificity from 97.1% to 98.9% with PPV and NPV ranging from 94.5% to 97.7% and 91.1% to 94.2%, respectively. The subsequent subgroup analysis (diabetes, hypertension, and <65 and ≥65 years) and also the comparisons of predicted prevalence in a cohort of older adults relative to published data emphasized the accuracy of our algorithm for patients with severe CKD (CKD G4-5ND).
Limitations: Our cohort comprised mostly older adults, and results may not be generalizable to all adults. Participants with CKD without 2 serum creatinine measurements up to 1 year apart were excluded.
Conclusions: The case definition of severe CKD G4-5ND derived from an algorithm using diagnosis code, drug use, and nephrologist visits from administrative databases is a valid algorithm compared with medical chart reviews in older adults.
Contexte: L’insuffisance rénale chronique (IRC) est un problème de santé majeur et un facteur de risque cardiovasculaire. La validité de la détection de l’IRC à partir des bases de données administratives est importante pour les études évaluant en situation réelle les bénéfices et les risques des médicaments. Les algorithmes existants comportent des limites et, compte tenu de l’importance revêtue par ce rapport bénéfices/risques, le développement de nouveaux algorithmes utilisant les bases de données administratives s’avère essentiel.
Objectif: Valider le pouvoir prédictif d’un algorithme pour détecter l’insuffisance rénale chronique sévère (DFGe <30 mL/min/1.73 m2, patient non-dialysé ou CKD G4-5ND) à partir des banques de données administratives de la province de Québec, avec le débit de filtration glomérulaire estimé (DFGe) comme point de référence.
Type d’étude: Étude de cohorte rétrospective réalisée à partir des dossiers médicaux et de données administratives.
Cadre: Des cliniques médicales communautaires et de protection rénale de Montréal et des régions rurales périphériques.
Sujets: Les dossiers médicaux de patients avec au moins deux mesures de la créatinine sérique (en moins d’un an) entre le 1er septembre 2013 et le 30 juin 2015 ont été revus consécutivement, en reculant dans le temps. Les patients avec insuffisance rénale terminale et dialysés ont été exclus. L’étude a débuté en septembre 2013.
Mesures: Le DFG a été estimé à l’aide de la formule CKD Epidemiological Collaboration (CKD-EPI) à partir du dossier médical de chaque patient. Nous avons développé différents algorithmes en utilisant trois banques de données administratives avec différentes combinaisons de facturations médicales (diagnostics et nombre de visites en néphrologie) et de données colligées au congé de l’hôpital dans les cinq ans précédant l’entrée dans la cohorte, de même qu’avec la consommation de certains médicaments et les interventions médicales subies en préparation à la dialyse dans les deux ans précédant l’entrée dans la cohorte.
Méthodologie: Les données des dossiers médicaux ont été utilisées pour définir le DFGe. La validité des algorithmes développés a été évaluée en utilisant la sensibilité, la spécificité, la valeur prédictive positive (VPP) et la valeur prédictive négative (VPN).
Résultats: En tout, 434 dossiers médicaux ont été revus; l’âge moyen des patients était de 74.2 ± 10.6 ans et 83% avaient plus de 65 ans. La sensibilité de l’algorithme no.3 (diagnostic dans un délai de 2 à 5 ans et/ou l’usage de médicaments spécifiques dans un délai de 2 ans, et au moins quatre visites médicales en néphrologie dans les 2 à 5 ans précédant la date d’entrée dans la cohorte) dans l’identification d’une insuffisance rénale sévère (CKD G4-5ND) variait de 82.5% à 89.0%. La spécificité de ce même algorithme variait de 97.1% à 98.9% avec une PPV et une NPV allant respectivement de 94.5.% à 97.7% et de 91.1% à 94.2%. L’analyse de sous-groupes (patients diabétiques, hypertendus, âgés de moins de 65 ans ou âgés de 65 ans et plus) ainsi que la comparaison de la prévalence prédite dans une cohorte de patients âgés par rapport aux données de la littérature font valoir la précision de notre algorithme pour les patients avec insuffisance rénale sévère (CKD G4-5ND).
Limites: Notre cohorte était composée essentiellement de sujets âgées, les résultats pourraient ne pas s’appliquer à tous les adultes. Les patients n’ayant pas eu deux mesures de la créatinine sérique à l’intérieur d’un an ont été exclus.
Conclusion: Chez les personnes âgées, la définition de cas pour une insuffisance chronique rénale sévère (CKD G4-5ND) estimée par un algorithme utilisant les codes diagnostic, la consommation de médicaments spécifiques et les services médicaux de néphrologie tirés des données administratives s’avère un algorithme valide comparativement à l’examen du dossier médical.
Keywords: administration database; chronic kidney disease; eGFR; population-based study; predictive positive value.
© The Author(s) 2020.