Propuesta de una versión abreviada de la escala de Zung para depresión

Luis Alfonso Díaz, M.D., M.Sc.¹, Adalberto Campo, M.D.², German Eduardo Rueda, M.D.³, Jaider Alfonso Barros, M.D.⁴

1. Profesor Asociado, Coordinador de la Línea de Investigación y Epidemiología, Facultad de Medicina, Grupo de Neuropsiquiatría UNAB, Facultad de Medicina, Universidad Autónoma de Bucaramanga, Bucaramanga, Colombia. e-mail: ldiaz6@unab.edu.co
2. Profesor Asociado, Línea de Salud Mental, Facultad de Medicina, Grupo de Neuropsiquiatría UNAB, Facultad de Medicina, Universidad Autónoma de Bucaramanga, Bucaramanga, Colombia. e-mail: acampoar@unab.edu.co
3. Profesor Asociado, Coordinador de la Línea de Salud Mental, Facultad de Medicina, Grupo de NeuropsiquiatríaUNAB, Facultad de Medicina, Universidad Autónoma de Bucaramanga, Bucaramanga, Colombia.e-mail: gredu@unab.edu.co
4. Profesor Asociado, Línea de Salud Mental, Facultad de Medicina, Grupo de Neuropsiquiatría UNAB, Facultad de Medicina, Universidad Autónoma de Bucaramanga, Bucaramanga, Colombia. e-mail: jbarros@unab.edu.co
Recibido para publicación agosto 31, 2004 Aprobado para publicación junio 27, 2005

RESUMEN

ANTECEDENTES: Los criterios para episodio depresivo mayor (EDM) han cambiado desde la introducción de la escala de Zung para depresión (EZ-D); sin embargo, su uso continúa como instrumento de tamización.

OBJETIVO: Validar la EZ-D de 20 preguntas y diseñar una versión abreviada de ella.

MÉTODO: Diligenciaron la EZ-D 138 estudiantes universitarios entre 16 y 33 años (promedio 22.8, DE 3.3), 79.7% mujeres, y se entrevistaron para identificar un episodio depresivo mayor con la entrevista estructurada para trastornos del eje I (SCID-I). Se determinó alfa de Cronbach, validez de criterio, análisis de factores y curva ROC para estimar el mejor punto de corte para la versión original y las subsecuentes escalas abreviadas.

RESULTADOS: De total de estudiantes, 26 (18.8%) presentaban un EDM según la SCID-I. Se encontró que 10 de las 20 preguntas de la versión original de EZ-D tamizaban con igual certidumbre a los pacientes que la versión completa. Para la versión original, el alfa de Cronbach fue 0.875, la sensibilidad 0.96, la especificidad 0.71, la kappa 0.441 y el área bajo de la curva ROC 0.86 para un punto de corte de 53. Dos factores principales explicaban cerca de 38% de la varianza. Para la versión abreviada, el alfa de Cronbach fue 0.845, la sensibilidad 0.92, la especificidad 0.71, la kappa 0.383 y el área bajo de la curva ROC 0.84 para el punto de corte de 22. Un factor principal que daba cuenta de aproximadamente 40% de la varianza.

CONCLUSIONES: La EZ-D de 20 preguntas es un instrumento válido en la identificación de EDM en estudiantes universitarios lo mismo que la versión abreviada de 10 preguntas.

Palabras clave: Escala de Zung para depresión; Validación; Estudiantes; Universitarios.

Proposing a short version of Zung’s self-rating depression scale

SUMMARY

BACKGROUND: Criteria for the major depressive disorder have changed since introduction of Zung’s self-rating depression scale (SDS); however, it is still used as a screening tool.

OBJECTIVE: To validate the SDS 20 item-version, and to design a short version of SDS.

METHOD: One-hundred thirty-eight university students filled out the scale, they were 17 to 33 year-old (mean 22.8 year, SD 3.3), 79.7% were female. They were interviewed by a psychiatrist in order to identify a current major depressive episode (MDE) using SCID-I criteria. We estimated Cronbach’ s alpha, criterion validity, factorial analysis, and ROC curve to define the best cut-off point for original SDS and new versions.

RESULTS: Twenty-six (18.8%) students met criteria for MDE according to SCID-I. We found that ten items of the original SDS screened as accurate as the original SDS did. The original SDS had Cronbach’ s alpha of 0.875, sensitivity of 0.96, specificity of 0.71, Cohen’s kappa of 0.441 and ROC curve area of 0.86 for a cut-point of fifty-three. Two salient factors explained near 38% of the variance. Ten-item version had Cronbach’s alpha of 0.845, sensitivity of 0.92, specificity of 0.71, Cohen’s kappa of 0.383 and ROC curve area of 0.84 for a cut-off point of twenty-two. One salient factor accounted for 40% of the variance approximately.

CONCLUSIONS: Ten-item SDS is a valid scale to screen major depressive episode among university students.

Key words: Zung’ self-rating depression scale; Validation; Students; University.

La escala de Zung para depresión se diseñó para determinación de severidad de un episodio depresivo mayor (EDM) en pacientes psiquiátricos hospitalizados y se publicó en 1965¹. Sin embargo, la escala se ha utilizado como instrumento de identificación de posibles casos de EDM en personas hospitalizadas por enfermedades médicas y en la población general^2-5.

La conceptualización y los criterios para definir un EDM, así como de otros trastornos mentales, ha cambiado en forma significativa durante las últimas cuatro décadas⁶. Sin embargo, la EZ-D se sigue utilizando como un instrumento de tamización o diagnóstico en diferentes poblaciones con relativa validez y confiabilidad^7-9. No obstante, en Colombia hasta la fecha no se cuenta con una validación formal de la EZ-D, es decir, se desconocen las propiedades psicométricas en poblaciones clínicas y en las diferentes comunidades que constituyen el país.

El concepto actual de un EDM se basa en los criterios diagnósticos de la Asociación Psiquiátrica Americana (APA) o de la Organización Mundial de la Salud (OMS)^6,10. Mientras que la conceptualización de EDM en que se fundamentó el diseño de la EZ-D es muy distinta a la noción que se tiene hoy de éste. Por ejemplo, la escala cuantifica síntomas como la constipación y el deseo sexual que no están explícitos en los criterios para EDM de la APA y la OMS^1,6,10. Además, la traducción de algunas preguntas de la versión utilizada en el Estudio Nacional de Salud Mental y Consumo de Sustancias Psicoactivas de 1993, la más popular en Colombia¹¹, tiene imprecisiones lingüísticas¹². Estas preguntas podrían afectar la validez y la confiabilidad de la escala en algunos sectores de la población o en ciertas circunstancias, limitando la utilidad como instrumento de tamización¹³.

Es importante conocer la validez de la EZ-D en estudiantes universitarios colombianos. La validez de los resultados de varias investigaciones que utilizaron esta escala es limitada, a pesar que informaron una prevalencia alta de síntomas depresivos con importancia clínica en este grupo poblacional^14-18, frecuencia significativamente mayor a la encontrada en la comunidad general¹¹.

El objetivo de este estudio fue validar y evaluar la posibilidad de diseñar una versión corta de la escala de Zung para depresión en estudiantes universitarios de Bucaramanga, Colombia.

MÉTODO

El presente es un estudio de validación concurrente de una escala para tamización. Se realizó durante el segundo semestre del año 2003. El proyecto lo evaluó y lo aprobó el Comité de Ética de la Facultad de Medicina de la Universidad Autónoma de Bucaramanga (UNAB) y representaba un riesgo mínimo para quienes aceptaran participar¹⁹. Se solicitó la participación enteramente voluntaria de los estudiantes después de explicar los objetivos de la investigación, garantizar la confidencialidad e informar que no recibirían ningún incentivo por su aceptación.

Para la fecha la UNAB constaba con 5.687 estudiantes matriculados en 18 carreras. Un total de 138 estudiantes de todas las facultades, diurna y nocturnas, participaron en este estudio, con excepción de medicina y psicología, que se excluyeron por conveniencia; 110 (79.9%) eran mujeres. La edad de los evaluados oscilaba entre 16 y 33 años, con un promedio 22.8 (DE 3.3) años.

El instrumento a validar, la EZ-D, es una escala autoadministrada tipo Likert que consta de veinte preguntas que se diligenciaban marcando con una equis la frecuencia de los síntomas durante los últimos quince días, dos últimas semanas y con puntuaciones de uno a cuatro para cada punto y globales entre 20 y 80. La puntuación de 40 se toma como punto de corte, es decir, se considera como síntomas depresivos con importancia clínica o sugestivo de un EDM; usualmente este puntaje se multiplica por el factor 1.25 y se obtienen puntuaciones entre 25 y 100, donde 50 ó más puntos sugieren EDM¹. Para comparar los resultados de la escala se aplicó el módulo para identificar un EDM actual de la entrevista estructurada para los trastornos del eje I (SCID-I)²⁰.

Los estudiantes que aceptaron diligenciar la escala lo hicieron en el aula de clase y luego se les citó para una entrevista con un especialista en psiquiatría. Tanto estudiantes como entrevistadores estaban enmascarados respecto al resultado de la prueba EZ-D. Los estudiantes que reunieron criterios para EDM u otro trastorno se remitieron a Bienestar Universitario para seguimiento por psicología o al psiquiatra para manejo especializado por la empresa promotora de salud.

Para determinar la consistencia interna de las escalas, tanto la original como las derivadas posteriormente, se halló el valor de alfa de Cronbach de cada una²¹. Se exploró la validez de concepto de la EZ-D por medio de análisis factorial para identificar los diferentes dominios o factores principales de la escala completa (autovalores superiores a 1.40) y los aportes de cada pregunta a la puntuación global²². También se procedió a estimar la sensibilidad, especificidad y concordancia global (por medio del valor de la kappa de Cohen²³) para el punto de corte de mayor rendimiento según la curva ROC²⁴. Para explorar la posibilidad de una versión corta de la EZ-D con el mismo rendimiento diagnóstico, se eliminó sucesivamente el punto que mostraba una menor correlación con el puntaje total, evaluado por el método de máxima verosimilitud la curva ROC de la prueba de 20 preguntas versus la resultante de la eliminación de las preguntas. Este proceso se realizó de manera progresiva hasta encontrar diferencias significativas, ya fuese entre las curvas ROC o los indicativos de sensibilidad o especificidad. Todas las pruebas estadísticas se realizaron con STATA 8.0²⁵.

RESULTADOS

De los 138 estudiantes universitarios entrevistados, 26 (18.8%, IC 95% 12.7-26.4) presentaba EDM según SCID-I; a su vez, 59 resultaron positivos en la versión original de la EZ-D (42.8%, IC 95% 34.4-51.5). La prueba de kappa fue 0.441, con sensibilidad de 96.2% (IC 95% 80.4-99.9) y especificidad de 70.5% (IC 95% 64.7-76.3). El alfa de Cronbach de la EZ-D original fue 0.875, donde el análisis de factores indicó que todas las preguntas están incluidas en dos factores principales que explicaban 37.6% de la varianza (29.3% y 8.3%, respectivamente).

Durante el proceso de eliminación de las preguntas de la EZ-D de la versión original no se produjeron cambios en el rendimiento de la prueba luego de eliminar las preguntas 2, 4, 6, 7 y 20. Luego, fue posible eliminar cinco preguntas más sin encontrar diferencias entre los indicadores de desempeño de estas nuevas versiones y la versión completa; una potencial versión de la EZ-D de nueve preguntas presentó diferencias significativas, por lo que se suspendió este proceso con la generación de una versión abreviada de la EZ-D con diez preguntas (Cuadro 1). En el Cuadro 2 y la Gráfica 1 se puede ver el comportamiento de la curva ROC de algunas de las versiones generadas que fueron importantes en el proceso de selección. De la misma manera, en el Cuadro 3 se puede ver la sensibilidad y especificidad que se halló para algunos puntos de corte de esas mismas versiones, con los puntajes netos (no multiplicados por el factor 1.25).

Como uno de los potenciales usos de la EZ-D es el de tamización, se considera adecuado para ello un punto de corte de 22 ó superior en la versión abreviada de 10 preguntas. Así, el alfa de Cronbach es de 0.845, la kappa media de Cohen de 0.383, la sensibilidad de 92.3% (IC95% 87.9-96.7) y la especificidad de 71.4% (IC 95% 63.9-78.9). Esta versión también mostró un único factor principal responsable de 40.5% de la varianza.

DISCUSIÓN

Los resultados de este estudio muestran que la versión original de la EZ-D tiene excelente consistencia interna y sensibilidad, así como buena especificidad como instrumento de tamización de EDM, además uno o dos factores principales que explican alrededor de 40% de la varianza. Estas características se conservan con la versión abreviada, con la ventaja que significa un instrumento de más fácil diligenciamiento.

Versiones abreviadas de la EZ-D y otras escalas se han validados en otras poblaciones^26-28. El deseo de reducir el número de preguntas en el proceso de tamización ha llevado al diseño de instrumentos con una y dos preguntas^29-31. Sin embargo, el uso de estas versiones abreviadas, por lo general de diez preguntas, no se ha popularizado. Es evidente que utilizar versiones cortas que conservan la validez de las versiones largas es de mucha importancia en algunas poblaciones y tipos de estudios. Las versiones corta de la EZ-D validada para población geriátrica tenía como objetivo minimizar el sesgo por fatiga asociados con escalas de mayor número de incisos²⁶. Asimismo, las versiones cortas tienen la misma ventaja en estudios de tamización en pacientes que solicitan consulta de atención primaria y en población general²⁹. En Colombia, este tipo de tamización sería muy útil conociendo la alta prevalencia de EDM en la población general³² y el número reducido de personas que consultan por estos síntomas, a pesar de la severidad de los mismos y de la discapacidad que producen^32,33.

Los resultados presentados ayudarán a interpretar con la debida prudencia los hallazgos de prevalencia de trastornos depresivos cuando el instrumento de valoración del estado emocional de paciente fue la EZ-D y con recelo si la escala no ha sido formalmente validada en dicha población^12,34. Indudablemente, se deben hacer ajustes en los puntos de corte según el grupo poblacional estudiado, como se observa en el Estudio Nacional de Salud Mental de 1993¹¹, donde la prevalencia de depresión podía encontrarse en el 11% cuando se reconsideró posteriormente el punto de corte³⁵. Tal vez, la prevalencia de trastornos depresivo en universitarios sea similar a las encontradas en la población general si el diagnóstico se hace mediante una entrevista clínica o usando la EZ-D con un punto de corte más alto como lo sugiere el presente estudio y no tan elevada como se informó en las investigaciones que, sin validación, hallaron prevalencias superiores^14-18.

Se concluye que la EZ-D de veinte preguntas y la versión abreviada presentan una excelente consistencia interna, una buena validez de criterio basada en las pautas vigentes para el diagnóstico de un EDM, con una excelente sensibilidad y buena especificidad como instrumento de tamización en población de estudiantes universitarios. Es necesario validar esta versión de la EZ-D en otras poblaciones con características sociodemográficas distintas.

AGRADECIMIENTOS

A los estudiantes Alexander Ballesteros, Mayerli Barcasnegras, Diego Laverde, Jorge Ortiz, Andrea Pertuz y Jaider Salcedo por su valiosa colaboración en el proceso logístico. Este proyecto lo financió la Dirección de Investigaciones de la Universidad Autónoma en el marco del proceso de investigación formativa.

REFERENCIAS

1. Zung WWK. Self-report depression scale. Arch Gen Psychiatry 1965; 12: 63-70.
2. Raft D, Spencer RF, Toomey T, Brogan D. Depression in medical outpatients: use of the Zung scale. J Dis Nerv System 1987; 38: 999-1004.
3. Zung WWK, MacDocnald J, Zung EM. Prevalence of clinically significant depressive symptoms in black and white patients in family practice setting. Am J Psychiatry 1988; 145: 882-883.
4. Dugan W, McDonald MV, Passik SD, Rosenfeld BD, Theobald D, Edgerton S. Use the Zung self-rating depression scale in cancer patients: feasibility as a screening tool. Psychooncology 1998; 7: 483-493.
5. Pareja-Ángel J, Campo-Arias A. Prevalencia de síntomas de ansiedad y de depresión en mujeres con migraña. Rev Neurol 2004; 39: 711-714.
6. American Psychiatric Association. Diagnostic and Statistical Manual of Mental Disorders. 4th ed. Text revised. Washington DC: American Psychiatric Association; 2000.
7. Lee HC, Chiue K, Wing YK, Leung CM, Kwong PK, Chung DWS. The Zung self-rating depression scale: screening for depression among the Hong Kong Chinese elderly. J Geriatr Psychiatry Neurol 1994; 7: 216-20.
8. Aragonés E, Masdeu RM, Cando G, Coll G. Validez diagnóstica de la Self-rating Depresión Scale de Zung en pacientes de atención primaria. Actas Esp Psiquiatr 2001; 29: 310-316.
9. Powell R. Psychometric properties of the Beck Depression Inventory and the Zung Self Rating Depression Scale in adults with mental retardation. Ment Retard 2002; 41: 88-95.
10. Organización Mundial de la Salud. Clasificación Internacional de las Enfermedades (CIE). Trastornos mentales y del comportamiento. Criterios diagnósticos de investigación. 10a ed. Madrid: Meditor; 1993.
11. Posada JA, Torres Y. Estudio nacional de salud mental y consumo de sustancias psicoactivas, Colombia, 1993. Bogotá: Ministerio de Salud; 1995.
12. Rubio-Stipec M, Hicks MHR, Tsuang MT. Cultural factors influencing the selection, use, and interpretation of psychiatric measures. In: Rush AJ, Pincus HA, First MB, et al. (eds.) Handbook of psychiatric measures. Washington, D.C.: American Psychiatric Association; 2002 (CD-ROM).
13. Blacker D, Endicott J. Psychometric properties: concepts of reliability and validity. In: Rush AJ, Pincus HA, First MB, et al. (eds.) Handbook of psychiatric measures. Washington, D.C.: American Psychiatric Association; 2002 (CD-ROM).
14. Amézquita ME, González RE, Zuluaga D. Prevalencia de la depresión, ansiedad y comportamiento suicida en la población estudiantil de pregrado de la Universidad de Caldas, año 2000. Rev Colomb Psiquiatr 2003; 32: 341-356.
15. Campo-Cabal G, Gutiérrez JC. Psicopatología en estudiantes universitarios de la Facultad de Salud, Univalle. Rev Colomb Psiquiatr 2001; 30: 351-358.
16. Arboleda A, Gutiérrez JC, Miranda CA. Prevalencia de síntomas depresivos en médicos internos y residentes de la Universidad del Valle, 1999. Médicas UIS 2001; 15: 4-7.
17. Miranda CA, Gutiérrez JC, Bernal F, Escobar CA. Prevalencia de depresión en estudiantes de medicina de la Universidad del Valle. Rev Colomb Psiquiatr 2000; 29: 251-260.
18. González A, Campo A, Haydar R. Síntomas depresivos en estudiantes de psicología. Acta Psiquiatr Psicol Am Lat 1999; 45: 234-239.
19. Ministerio de Salud. Resolución 008430 de 1993, por la cual se establecen las normas científicas, técnicas y administrativas para la investigación en salud. Rev Colomb Psiquiatr 1996; 25: 38-59.
20. First MB, Spitzer RL, Gibbon M, Williams JBW. Entrevista clínica estructurada para los trastornos de eje I del DSM-IV (versión clínica) SCID-I. Barcelona: Masson; 1999.
21. Cronbach LJ. Coefficient alpha and the internal structure of test. Psychometrika 1951; 16: 297-334.
22. Norman GR, Streiner DL. Bioestadística. Madrid: Mosby, Doyma Libros; 1996. p. 129-142.
23. Cohen J. A coefficient of agreement for nominal scales. Educ Psychol Meas 1960; 20: 27-46.
24. Rey JM, Morris-Yates A, Stanislaw H. Measuring the accuracy of diagnostic test using receiver operating characteristics (ROC) analysis. Int J Methods Psychiatr Res 1992; 2: 39-50.
25. STATA for windows 8.0. Stata Corporation, College Station, Texas, 2003.
26. Tucker MA, Ogle SJ, Davidson JG, Eilenberg MD. Validation of a brief screening test for depression in the elderly. Age Ageing 1987; 16: 139-144.
27. Irwin M, Artin KH, Oxman MN. Screening for depression in the older adult. Criterion validity of the 10-item Center for Epidemiological Studies Depression Scale (CES-D). Arch Intern Med 1999; 159: 1701-1704.
28. Lelito RH, Palumbo LO, Hanley M. Psychometric evaluation of a brief depression screen. Aging Ment Health 2001; 5: 387-393.
29. Arrol B, Khin N, Kerse N. Screening for depression in primary care with two verbally asked questions: cross sectional study. Br Med J 2003; 327: 1144-1146.
30. Chochinov HM, Wilson KG, Enns M, Lander S. «Are you depressed». Screening for depression in the terminally ill. Am J Psychiatry 1997; 154: 674-676.
31. Mallon L, Hetta J. Detección de la depresión mediante cuestionarios: comparación de una sola pregunta con los datos de la entrevista en una muestra de adultos de edad avanzada. Eur J Psychiatry 2002; 16: 139-148.
32. Posada-Villa JA, Trevisi C. Prevalencia, severidad y necesidades no satisfechas del tratamiento de los trastornos de ansiedad, relacionados con sustancias, del estado de ánimo y del control de impulsos en adultos según el Estudio Nacional de Salud Mental, Colombia, 2003. Medunab 2004; 7: 65-72.
33. Rodríguez CE, Puerta G. Prevalencia de síntomas de depresión y ansiedad en pacientes de consulta no psiquiátrica. Rev Colomb Psiquiatr 1997; 26: 273-288.
34. Sánchez R, Gómez C. Conceptos básicos sobre la validación de escalas. Rev Colomb Psiquiatr 1998; 27: 121-130.
35. Gómez C, Rodríguez N. Factores de riesgo asociados al síndrome depresivo en la población colombiana. Rev Colomb Psiquiatr 1997; 26: 23-35.