CoPEP

Propriedades psicométricas da Dutch Fatigue Scale e Dutch Exertion Fatigue Scale: versão brasileira

INTRODUÇÃO A fadiga é um fenômeno subjetivo e multicausal cuja origem e expressão envolvem aspectos físicos, cognitivos e emocionais e depende de auto-relato para ser identificada(1). Pelo impacto que tem na qualidade de vida(2), é importante que a fadiga seja diagnosticada, mas, por ser fenômeno subjetivo, é facilmente omitida ou confundida com outras respostas. Dispor de instrumento padronizado para avaliar a fadiga é importante não só para a pesquisa sobre essa resposta, como também para o cuidado dos pacientes.

A fadiga é um diagnóstico de enfermagem, faz parte da classificação da North American Nursing Diagnosis Association - International (NANDA-I), introduzido em 1988 e é definida como uma sensação opressiva e sustentada de exaustão e de capacidade diminuída para realizar trabalho físico e mental no nível habitual (3). As características definidoras são incapacidade de restaurar energia mesmo após o sono, aumento das necessidades de repouso, cansaço, incapacidade de manter as rotinas habituais, aumento das queixas físicas, necessidade percebida de energia adicional para realizar tarefas de rotina, sonolento, concentração comprometida, sentimento de culpa por não cumprir suas responsabilidades, falta de energia ou incapacidade de manter o nível habitual de atividade física, verbalização de uma constante e opressiva falta de energia, desempenho diminuído, desinteresse quanto ao ambiente que o cerca, introspecção e libido diminuída.

A fadiga ocorre em diversas condições agudas e crônicas, assim como na população geral(4) e foi identificada como fator preditivo de doenças em estudos longitudinais(5). A freqüência de fadiga nos pacientes com insuficiência cardíaca é alta(6-7), está entre os sintomas mais freqüentes(7- 10) e é mais intensa que em grupos controle(9-10).

Os estudos sobre fadiga referem-se principalmente à determinação da sua prevalência, à sua caracterização e ao desenvolvimento de instrumentos para sua avaliação(11). Nos estudos em condições específicas, como na insuficiência cardíaca, a fadiga é avaliada com instrumentos específicos ou com parte de instrumentos propostos para estudar variáveis mais amplas como a qualidade de vida.

Os pacientes com insuficiência cardíaca expressam inúmeras respostas à sua condição primária que interferem nas esferas biológica, social, psicológica, mental e espiritual. Daí a necessidade de descrever os sintomas mais frequentes nessa população para que as intervenções sejam propostas de forma direcionada, sistematizada e fundamentada. Nos estudos de pacientes com insuficiência cardíaca, há enorme variedade nas estratégias de avaliação da fadiga. Há estudos em que não se informa como a fadiga foi avaliada(12-14); estudos em que a variável é avaliada por escala criada ou adaptada pelo próprio autor(15-17); estudo em que o autor apenas descreve que foi relato dos pacientes(18) ou registro de prontuário(7) e estudos em que foram usados instrumentos padronizados(9-10,19-22) ou partes de instrumentos padronizados (2,6,8,16,21,23).

Apesar da diversidade de instrumentos existentes na literatura para avaliar fadiga, há apenas dois adaptados para uso no Brasil. Um deles foi adaptado com amostra de pacientes de cuidados primários(24) e o outro com pessoas com câncer (25).

A Dutch Fatigue Scale (DUFS) e a Dutch Exertion Fatigue Scale (DEFS) foram desenvolvidas conforme a definição de fadiga da NANDA-I com pacientes com insuficiência cardíaca(26). Devido ao interesse de estudar o diagnóstico de fadiga, segundo a NANDA-I, em pacientes com insuficiência cardíaca, resolveu-se adaptar a DUFS e a DEFS para o Brasil.

A DUFS e a DEFS foram desenvolvidas por três holandeses (Tiesinga, Dassen e Halfens) e publicadas em 1998(26). A DUFS mede fadiga definida como "uma sensação opressiva e sustentada de exaustão e de capacidade diminuída para realizar trabalho físico e mental no nível habitual"(3). A DEFS mede fadiga ao esforço definida como a 'fadiga que é diretamente relacionada à atividade'(26).

A DUFS, uma escala de auto-relato, foi originalmente composta por 9 itens, tipo Likert com 5 pontos (1-5). Durante a adaptação do instrumento para este estudo, um dos autores do mesmo (Lucas Tiesinga), em mensagem eletrônica, orientou para a eliminação de um dos itens da DUFS (originalmente item 8) que tratava de medir a disposição e a iniciativa de fazer coisas que a pessoa tem vontade de fazer, pois em estudo em andamento, os resultados indicavam claramente que a exclusão desse item não interferiria na consistência interna do mesmo. Com a exclusão de um dos nove itens originais a DUFS foi testada, neste estudo, com 8 itens. Os escores nos itens podem ser somados num escore total que varia de 8 a 40 (quanto mais alto o escore, maior a intensidade da fadiga). O item 6 precisa ser corrigido antes de se computarem os escores totais, pois o conteúdo de seu enunciado tem sentido contrário aos dos demais.

A fonte de itens para a DUFS foram as características definidoras de fadiga propostas pela NANDA - I. Para a DEFS, que mede a fadiga ao esforço, os itens foram extraídos de uma lista de 62 atividades de vida diária e sociais relacionadas à fadiga. A primeira versão da DEFS incluiu esses 62 itens. Foram aplicados testes estatísticos para verificar consistência interna, validade concorrente, validade de critério, além de análise fatorial e validade de conteúdo(26), após o que permaneceram nove itens. Todos foram incluídos na DEFS aplicada neste estudo.

A consistência interna da DUFS e DEFS foi testada em amostras de pacientes em geral, pacientes com insuficiência cardíaca, de mulheres no puerpério e de pacientes idosos em instituições de longa permanência(26). Nessas aplicações os autores dicotomizaram as respostas para as análises estatísticas, razão pela qual usaram o KR-20 para estimar a consistência interna. O KR-20 fornece coeficientes de consistência interna para escalas em que as respostas aos itens são dicotômicas. Os índices do KR-20 para o DUFS variaram entre 0,79 e 0,89 e para o DEFS entre 0,86 e 0,91(26), o que indicou boa confiabilidade. Até o preparo deste artigo não havia publicação em que a consistência interna tivesse sido avaliada pelo alfa de Cronbach.

A validade de critério das escalas foi testada com 138 pacientes(26) observando-se correlações de 0,85 e 0,52 entre a DUFS e a DEFS, respectivamente, e medidas de exaustão vital (Maastricht Interview Vital Exhaustion)(26) e de -0,44 e -0,31 com qualidade do sono(26).

OBJETIVO O objetivo deste artigo é relatar o estudo de adaptação e validação da Dutch Fatigue Scale (DUFS) e da Dutch Exertion Fatigue Scale (DEFS) para o Brasil.

MÉTODO O estudo foi realizado com 300 pacientes em acompanhamento em um ambulatório de insuficiência cardíaca e com 64 voluntários sem insuficiência cardíaca, acompanhantes de pacientes ambulatoriais no mesmo serviço. O estudo foi aprovado por Comitê de Ética em Pesquisa e todos os participantes assinaram termo de conhecimento livre e esclarecido.

Além da DUFS e DEFS em língua portuguesa, foram investigadas outras variáveis para as estimativas de validade das escalas em estudo: classe funcional da insuficiência cardíaca (só para os pacientes) seguindo o padrão da New York Heart Association(27); depressão segundo o Inventário de Depressão de Beck (IDB)(28) e distúrbio do sono segundo as respostas ao item 16 do inventário de Depressão de Beck (IDB)(28).

Para gerar uma versão em português da DUFS e da DEFS foi utilizado o método de back translation. A primeira versão do inglês para o português foi feita pelas autoras e submetida ao profissional tradutor para correção. A primeira versão na língua portuguesa foi re-vertida para o inglês por um segundo profissional tradutor que não tinha conhecimento da escala original. As duas versões na língua inglesa foram comparadas por um dos autores da escala com a finalidade de identificar inconsistências que denotassem perda de significado na versão em língua portuguesa. As sugestões do autor foram discutidas e incorporadas obtendo-se a segunda versão em português. A segunda versão em português foi aplicada em 5 pacientes para testá-la quanto à compreensão. Como não houve necessidade de ajustes nas escalas esses pacientes foram incorporados à amostra deste estudo.

Os dados obtidos por meio da aplicação da DUFS e DEFS aos pacientes e voluntários deste estudo foram analisados para estimar a consistência interna e a validade de construto da versão brasileira das escalas.

Com o objetivo de confirmar a existência de dois domínios para a avaliação da fadiga, um referente aos itens do DUFS e o outro aos itens do DEFS, a análise fatorial pelo método das componentes principais(29) foi realizada com todos os 17 itens que avaliam a fadiga, 8 referentes ao DUFS e 9 ao DEFS. Foi aplicada rotação ortogonal varimax e o método para a seleção do número de componentes foi o de Kaiser, ou seja, autovalores maiores que 1. O objetivo da análise de componentes principais é a obtenção de um pequeno número de combinações lineares (componentes principais) de um conjunto de variáveis, que retenham o máximo possível da informação contida nas variáveis originais. Esse tipo de análise visa reduzir a dimensionalidade dos dados, agrupando os itens mais correlacionados em fatores (componentes).

Quanto à confiabilidade do instrumento em português, foram feitas estimativas de consistência interna pelo alfa de Cronbach(30). Esse coeficiente indica a confiabilidade da escala, varia entre 0 e 1 e quanto maior este valor melhor a confiabilidade. A confiabilidade medida pelo alfa de Cronbach refere-se unicamente à consistência interna do indicador: se os itens utilizados associam-se coerentemente na medida de um fenômeno e com que intensidade isto se verifica numa escala de zero a um.

O critério para a manutenção dos itens foi o efeito de sua retirada na confiabilidade. Mantiveram-se os itens cuja exclusão não aumentaria de forma importante o alfa, e que obtiveram correlação item-total maior ou igual a 0,2.

Para definir pontos de corte para os escores DUFS e DEFS pelos quais essas variáveis pudessem ser medidas em termos de freqüências e não só de intensidades projetou-se a ROC (Receive Operator Caracteristic Curve). O ponto de corte obtido pela ROC é guiado pela sensibilidade (proporção de resultados verdadeiros-positivos) e especificidade (proporção de resultados verdadeiros- negativos). A medida padrão de referência para construir a ROC foi o item 17 do Inventário de Depressão de Beck (IDB56) que avalia fadiga. Respostas ao item 17 do IDB iguais a zero foram categorizadas como fadiga ausente e respostas a esse item maiores que zero foram categorizadas como fadiga presente.

A validade da DUFS e DEFS foi estimada pelo teste das hipóteses de que maiores escores de fadiga associam-se a maiores escores de depressão; de que há associação entre fadiga e distúrbio de sono e entre fadiga e classe funcional da insuficiência cardíaca entre os pacientes.

RESULTADOS Do total da amostra do estudo (N=364), 62,4% eram mulheres, 40% aposentados, 19,2% afastados por doença, 26,3% empregados e 14,5% desempregados, estudantes ou donas de casa; a idade média foi 50,7±13,9 anos, a escolaridade média 7,1±4,2 anos. Dos 300 pacientes, 95,7% tinham a miocardiopatia como diagnóstico médico principal; 44,7% estavam na classe funcional I (CFI), 38,7% na classe II (CFII) e 16,6% nas classes III ou IV (CFIII/IV).

Estatísticas descritivas sobre os escores dos pacientes (N=300) mostraram que o escore médio DUFS foi 19,4±8,2 e o DEFS foi 19,3±3,9. Para os voluntários (N=64) foram 16,8±6,1 na DUFS e 12,6±3,9 na DEFS.

A análise fatorial sobre o conjunto de itens da DUFS (8 itens) e da DEFS (9 itens) mostrou a presença de dois componentes principais (autovalores > 1), que explicaram 53,9% da variabilidade total. A Tabela_1 mostra a solução fatorial obtida com rotação Varimax.

Estão apresentadas nas Tabelas_2 e 3 as estimativas de confiabilidade da DUFS e da DEFS.

A análise fatorial (Tabela_1) mostrou que os itens 6 e 7 da DUFS ficariam mais bem colocados junto aos itens da DEFS. Testando-se o efeito da inclusão dos itens 6 e 7 na confiabilidade da DEFS obteve-se diminuição do seu alfa de 0,922 para 0,910.

As estimativas de confiabilidade da DUFS na amostra de pacientes com insuficiência cardíaca (N=300) foi 0,84 e na amostra de voluntários sem insuficiência cardíaca (N=64) foi 0,75. A da DEFS foi 0,92 para os pacientes e 0,73 para os voluntários.

Quanto aos pontos de corte, na DUFS ficou definido que escores totais maiores ou iguais a 14,5 correspondem a 'fadiga substancial' (ou presença de fadiga), segundo a ROC (Área sob a curva = 0,84, p=0,0001); e que escores totais maiores ou iguais a 12,5 na DEFS correspondem a 'fadiga substancial ao esforço' (ou presença de fadiga substancial ao esforço), também segundo a ROC (Área sob a curva = 0,87, p=0,0001).

Houve associação dos escores na DUFS e na DEFS com a classe funcional da insuficiência cardíaca (Kruskall-Wallis, p=0,000, nos dois casos). O teste de Bonferroni, aplicado para identificar as contribuições de cada grupo para essa diferença mostrou que a intensidade de fadiga é maior a medida que sobe a classe funcional. Os coeficientes de correlação de Spearman entre escores DUFS ou DEFS e os escores de depressão (IDB) foram rs=0,63 (p=0,00) e rs=0,55 (p=0,00), respectivamente, indicando correlação moderada significativa entre as variáveis. Houve também associação entre a presença de distúrbio de sono e intensidade de fadiga (escores DUFS) (Mann-Whitney, p=0,000) e intensidade de fadiga ao esforço (escore DEFS) (Mann-Whitney, p=0,000).

DISCUSSÃO Os resultados mostraram que a DUFS e a DEFS, escalas para avaliar a fadiga e a fadiga ao esforço, adaptadas para a língua portuguesa, podem ser usadas para avaliar grupos de pacientes na clínica e em pesquisas. As estimativas de validade e confiabilidade feitas em amostra de pacientes com insuficiência cardíaca e voluntários sem a doença mostraram resultados muito bons ou moderados.

A melhor solução da análise fatorial mostrou os itens 6 e 7 da DUFS com carga fatorial maior no fator correspondente à DEFS (Tabela_1). Esses itens referem- se, respectivamente, à percepção do indivíduo quanto a conseguir fazer as atividades do dia-a-dia e quanto ao interesse por manter relações sexuais, o que evoca aspectos de esforço físico. Talvez esse tenha sido o motivo por eles terem ficado com carga fatorial mais alta no fator que agrupou os itens provenientes da DEFS.

Os resultados da fatorial sugeriram a mudança dos itens 6 e 7 da DUFS para a DEFS. No entanto, os resultados de análise da confiabilidade dos instrumentos auxiliaram na decisão de manter a estrutura original das escalas. Observa-se na Tabela_2 (confiabilidade da DUFS) que a exclusão do item 6 provocaria diminuição da confiabilidade (de 0,848 para 0,835), o que não seria interessante; e que a exclusão do item 7 aumentaria o alfa de 0,848 para 0,859, o que não é aumento substancial. Além disso, a inclusão dos itens 6 e 7 na DEFS diminuiria o seu alfa de 0,922 para 0,910. Como essas alterações não melhorariam substancialmente a confiabilidade das escalas, decidiu-se manter a estrutura original das mesmas, também para permitir comparação com outros estudos.

Até o momento da elaboração deste artigo não se dispunha de relatos detalhados sobre a estrutura fatorial da DUFS e DEFS. A informação disponível era de que ambas têm apenas uma dimensão(26), o que foi reproduzido com a versão brasileira.

A confiabilidade da versão brasileira da DUFS na amostra total foi boa (alfa = 0,848) (Tabela_2) e a da DEFS foi muito boa (alfa = 0,922) (Tabela_3). O comportamento dos itens nas estimativas para pacientes e voluntários, separadamente, foi semelhante ao obtido para os dados do conjunto dos participantes no estudo. As escalas apresentaram confiabilidades muito boas ou boas no grupo de pacientes e de voluntários. Todos os itens foram mantidos na DUFS e na DEFS.

Quanto à validade das escalas, as três hipóteses testadas foram confirmadas.

Partiu-se dos pressupostos teóricos de que a fadiga é mais intensa nas classes funcionais mais elevadas da insuficiência cardíaca, quando os escores de depressão são mais elevados e quando há distúrbio do sono. Esses resultados foram semelhantes aos encontrados com as escalas no ambiente em que foram criadas(26).

Um aspecto que merece destaque é que não há definição para as escalas originais sobre o cálculo dos escores finais de cada respondente. Eles podem variar, na DUFS e na DEFS, de 1 a 5 se o escore final for a média aritmética dos escores em cada item. Se o escore final for a soma dos escores nos itens, na DUFS eles poderão variar de 8 a 40, e na DEFS de 9 a 45. Para que os resultados entre estudos possam ser comparáveis recomenda-se a transformação dos escores finais de todas as escalas para uma variação de 0 a 100.

CONCLUSÃO O estudo aqui relatado permitiu criar a Dutch Fatigue Scale - Versão Brasileira e a Dutch Exertion Fatigue Scale - Versão Brasileira com boas propriedades psicométricas e desempenho semelhante ao do instrumento original(26).

As duas escalas de fadiga poderão ser testadas em outras amostras de pacientes e em estudos de população geral. Conhecer o comportamento da fadiga em população geral, com instrumentação semelhante a que é usada com pacientes é importante para refinar as interpretações que são feitas sobre a prevalência e magnitude dessa resposta em amostras com diversas condições agudas e crônicas.

Instrumentos padronizados para avaliar diagnósticos de enfermagem, como a fadiga, são úteis também para pesquisas de refinamento dos diagnósticos. Tais instrumentos permitem operacionalizar os conceitos diagnósticos de modo reprodutível, aumentando a confiabilidade dos estudos em que esses conceitos são investigados.

Text view

BrBRCVHe0034-71672010000200008

View options