Propriedades psicométricas da Dutch Fatigue Scale e Dutch Exertion Fatigue
Scale: versão brasileira
INTRODUÇÃO
A fadiga é um fenômeno subjetivo e multicausal cuja origem e expressão envolvem
aspectos físicos, cognitivos e emocionais e depende de auto-relato para ser
identificada(1). Pelo impacto que tem na qualidade de vida(2), é importante que
a fadiga seja diagnosticada, mas, por ser fenômeno subjetivo, é facilmente
omitida ou confundida com outras respostas. Dispor de instrumento padronizado
para avaliar a fadiga é importante não só para a pesquisa sobre essa resposta,
como também para o cuidado dos pacientes.
A fadiga é um diagnóstico de enfermagem, faz parte da classificação da North
American Nursing Diagnosis Association - International (NANDA-I), introduzido
em 1988 e é definida como uma sensação opressiva e sustentada de exaustão e de
capacidade diminuída para realizar trabalho físico e mental no nível habitual
(3). As características definidoras são incapacidade de restaurar energia mesmo
após o sono, aumento das necessidades de repouso, cansaço, incapacidade de
manter as rotinas habituais, aumento das queixas físicas, necessidade percebida
de energia adicional para realizar tarefas de rotina, sonolento, concentração
comprometida, sentimento de culpa por não cumprir suas responsabilidades, falta
de energia ou incapacidade de manter o nível habitual de atividade física,
verbalização de uma constante e opressiva falta de energia, desempenho
diminuído, desinteresse quanto ao ambiente que o cerca, introspecção e libido
diminuída.
A fadiga ocorre em diversas condições agudas e crônicas, assim como na
população geral(4) e foi identificada como fator preditivo de doenças em
estudos longitudinais(5). A freqüência de fadiga nos pacientes com
insuficiência cardíaca é alta(6-7), está entre os sintomas mais freqüentes(7-
10) e é mais intensa que em grupos controle(9-10).
Os estudos sobre fadiga referem-se principalmente à determinação da sua
prevalência, à sua caracterização e ao desenvolvimento de instrumentos para sua
avaliação(11). Nos estudos em condições específicas, como na insuficiência
cardíaca, a fadiga é avaliada com instrumentos específicos ou com parte de
instrumentos propostos para estudar variáveis mais amplas como a qualidade de
vida.
Os pacientes com insuficiência cardíaca expressam inúmeras respostas à sua
condição primária que interferem nas esferas biológica, social, psicológica,
mental e espiritual. Daí a necessidade de descrever os sintomas mais frequentes
nessa população para que as intervenções sejam propostas de forma direcionada,
sistematizada e fundamentada. Nos estudos de pacientes com insuficiência
cardíaca, há enorme variedade nas estratégias de avaliação da fadiga. Há
estudos em que não se informa como a fadiga foi avaliada(12-14); estudos em que
a variável é avaliada por escala criada ou adaptada pelo próprio autor(15-17);
estudo em que o autor apenas descreve que foi relato dos pacientes(18) ou
registro de prontuário(7) e estudos em que foram usados instrumentos
padronizados(9-10,19-22) ou partes de instrumentos padronizados
(2,6,8,16,21,23).
Apesar da diversidade de instrumentos existentes na literatura para avaliar
fadiga, há apenas dois adaptados para uso no Brasil. Um deles foi adaptado com
amostra de pacientes de cuidados primários(24) e o outro com pessoas com câncer
(25).
A Dutch Fatigue Scale (DUFS) e a Dutch Exertion Fatigue Scale (DEFS) foram
desenvolvidas conforme a definição de fadiga da NANDA-I com pacientes com
insuficiência cardíaca(26). Devido ao interesse de estudar o diagnóstico de
fadiga, segundo a NANDA-I, em pacientes com insuficiência cardíaca, resolveu-se
adaptar a DUFS e a DEFS para o Brasil.
A DUFS e a DEFS foram desenvolvidas por três holandeses (Tiesinga, Dassen e
Halfens) e publicadas em 1998(26). A DUFS mede fadiga definida como "uma
sensação opressiva e sustentada de exaustão e de capacidade diminuída para
realizar trabalho físico e mental no nível habitual"(3). A DEFS mede fadiga ao
esforço definida como a 'fadiga que é diretamente relacionada à atividade'(26).
A DUFS, uma escala de auto-relato, foi originalmente composta por 9 itens, tipo
Likert com 5 pontos (1-5). Durante a adaptação do instrumento para este estudo,
um dos autores do mesmo (Lucas Tiesinga), em mensagem eletrônica, orientou para
a eliminação de um dos itens da DUFS (originalmente item 8) que tratava de
medir a disposição e a iniciativa de fazer coisas que a pessoa tem vontade de
fazer, pois em estudo em andamento, os resultados indicavam claramente que a
exclusão desse item não interferiria na consistência interna do mesmo. Com a
exclusão de um dos nove itens originais a DUFS foi testada, neste estudo, com 8
itens. Os escores nos itens podem ser somados num escore total que varia de 8 a
40 (quanto mais alto o escore, maior a intensidade da fadiga). O item 6 precisa
ser corrigido antes de se computarem os escores totais, pois o conteúdo de seu
enunciado tem sentido contrário aos dos demais.
A fonte de itens para a DUFS foram as características definidoras de fadiga
propostas pela NANDA - I. Para a DEFS, que mede a fadiga ao esforço, os itens
foram extraídos de uma lista de 62 atividades de vida diária e sociais
relacionadas à fadiga. A primeira versão da DEFS incluiu esses 62 itens. Foram
aplicados testes estatísticos para verificar consistência interna, validade
concorrente, validade de critério, além de análise fatorial e validade de
conteúdo(26), após o que permaneceram nove itens. Todos foram incluídos na DEFS
aplicada neste estudo.
A consistência interna da DUFS e DEFS foi testada em amostras de pacientes em
geral, pacientes com insuficiência cardíaca, de mulheres no puerpério e de
pacientes idosos em instituições de longa permanência(26). Nessas aplicações os
autores dicotomizaram as respostas para as análises estatísticas, razão pela
qual usaram o KR-20 para estimar a consistência interna. O KR-20 fornece
coeficientes de consistência interna para escalas em que as respostas aos itens
são dicotômicas. Os índices do KR-20 para o DUFS variaram entre 0,79 e 0,89 e
para o DEFS entre 0,86 e 0,91(26), o que indicou boa confiabilidade. Até o
preparo deste artigo não havia publicação em que a consistência interna tivesse
sido avaliada pelo alfa de Cronbach.
A validade de critério das escalas foi testada com 138 pacientes(26)
observando-se correlações de 0,85 e 0,52 entre a DUFS e a DEFS,
respectivamente, e medidas de exaustão vital (Maastricht Interview Vital
Exhaustion)(26) e de -0,44 e -0,31 com qualidade do sono(26).
OBJETIVO
O objetivo deste artigo é relatar o estudo de adaptação e validação da Dutch
Fatigue Scale (DUFS) e da Dutch Exertion Fatigue Scale (DEFS) para o Brasil.
MÉTODO
O estudo foi realizado com 300 pacientes em acompanhamento em um ambulatório de
insuficiência cardíaca e com 64 voluntários sem insuficiência cardíaca,
acompanhantes de pacientes ambulatoriais no mesmo serviço. O estudo foi
aprovado por Comitê de Ética em Pesquisa e todos os participantes assinaram
termo de conhecimento livre e esclarecido.
Além da DUFS e DEFS em língua portuguesa, foram investigadas outras variáveis
para as estimativas de validade das escalas em estudo: classe funcional da
insuficiência cardíaca (só para os pacientes) seguindo o padrão da New York
Heart Association(27); depressão segundo o Inventário de Depressão de Beck
(IDB)(28) e distúrbio do sono segundo as respostas ao item 16 do inventário de
Depressão de Beck (IDB)(28).
Para gerar uma versão em português da DUFS e da DEFS foi utilizado o método de
back translation. A primeira versão do inglês para o português foi feita pelas
autoras e submetida ao profissional tradutor para correção. A primeira versão
na língua portuguesa foi re-vertida para o inglês por um segundo profissional
tradutor que não tinha conhecimento da escala original. As duas versões na
língua inglesa foram comparadas por um dos autores da escala com a finalidade
de identificar inconsistências que denotassem perda de significado na versão em
língua portuguesa. As sugestões do autor foram discutidas e incorporadas
obtendo-se a segunda versão em português. A segunda versão em português foi
aplicada em 5 pacientes para testá-la quanto à compreensão. Como não houve
necessidade de ajustes nas escalas esses pacientes foram incorporados à amostra
deste estudo.
Os dados obtidos por meio da aplicação da DUFS e DEFS aos pacientes e
voluntários deste estudo foram analisados para estimar a consistência interna e
a validade de construto da versão brasileira das escalas.
Com o objetivo de confirmar a existência de dois domínios para a avaliação da
fadiga, um referente aos itens do DUFS e o outro aos itens do DEFS, a análise
fatorial pelo método das componentes principais(29) foi realizada com todos os
17 itens que avaliam a fadiga, 8 referentes ao DUFS e 9 ao DEFS. Foi aplicada
rotação ortogonal varimax e o método para a seleção do número de componentes
foi o de Kaiser, ou seja, autovalores maiores que 1. O objetivo da análise de
componentes principais é a obtenção de um pequeno número de combinações
lineares (componentes principais) de um conjunto de variáveis, que retenham o
máximo possível da informação contida nas variáveis originais. Esse tipo de
análise visa reduzir a dimensionalidade dos dados, agrupando os itens mais
correlacionados em fatores (componentes).
Quanto à confiabilidade do instrumento em português, foram feitas estimativas
de consistência interna pelo alfa de Cronbach(30). Esse coeficiente indica a
confiabilidade da escala, varia entre 0 e 1 e quanto maior este valor melhor a
confiabilidade. A confiabilidade medida pelo alfa de Cronbach refere-se
unicamente à consistência interna do indicador: se os itens utilizados
associam-se coerentemente na medida de um fenômeno e com que intensidade isto
se verifica numa escala de zero a um.
O critério para a manutenção dos itens foi o efeito de sua retirada na
confiabilidade. Mantiveram-se os itens cuja exclusão não aumentaria de forma
importante o alfa, e que obtiveram correlação item-total maior ou igual a 0,2.
Para definir pontos de corte para os escores DUFS e DEFS pelos quais essas
variáveis pudessem ser medidas em termos de freqüências e não só de
intensidades projetou-se a ROC (Receive Operator Caracteristic Curve). O ponto
de corte obtido pela ROC é guiado pela sensibilidade (proporção de resultados
verdadeiros-positivos) e especificidade (proporção de resultados verdadeiros-
negativos). A medida padrão de referência para construir a ROC foi o item 17 do
Inventário de Depressão de Beck (IDB56) que avalia fadiga. Respostas ao item 17
do IDB iguais a zero foram categorizadas como fadiga ausente e respostas a esse
item maiores que zero foram categorizadas como fadiga presente.
A validade da DUFS e DEFS foi estimada pelo teste das hipóteses de que maiores
escores de fadiga associam-se a maiores escores de depressão; de que há
associação entre fadiga e distúrbio de sono e entre fadiga e classe funcional
da insuficiência cardíaca entre os pacientes.
RESULTADOS
Do total da amostra do estudo (N=364), 62,4% eram mulheres, 40% aposentados,
19,2% afastados por doença, 26,3% empregados e 14,5% desempregados, estudantes
ou donas de casa; a idade média foi 50,7±13,9 anos, a escolaridade média
7,1±4,2 anos. Dos 300 pacientes, 95,7% tinham a miocardiopatia como diagnóstico
médico principal; 44,7% estavam na classe funcional I (CFI), 38,7% na classe II
(CFII) e 16,6% nas classes III ou IV (CFIII/IV).
Estatísticas descritivas sobre os escores dos pacientes (N=300) mostraram que o
escore médio DUFS foi 19,4±8,2 e o DEFS foi 19,3±3,9. Para os voluntários
(N=64) foram 16,8±6,1 na DUFS e 12,6±3,9 na DEFS.
A análise fatorial sobre o conjunto de itens da DUFS (8 itens) e da DEFS (9
itens) mostrou a presença de dois componentes principais (autovalores > 1), que
explicaram 53,9% da variabilidade total. A Tabela_1 mostra a solução fatorial
obtida com rotação Varimax.
Estão apresentadas nas Tabelas_2 e 3 as estimativas de confiabilidade da DUFS e
da DEFS.
A análise fatorial (Tabela_1) mostrou que os itens 6 e 7 da DUFS ficariam mais
bem colocados junto aos itens da DEFS. Testando-se o efeito da inclusão dos
itens 6 e 7 na confiabilidade da DEFS obteve-se diminuição do seu alfa de 0,922
para 0,910.
As estimativas de confiabilidade da DUFS na amostra de pacientes com
insuficiência cardíaca (N=300) foi 0,84 e na amostra de voluntários sem
insuficiência cardíaca (N=64) foi 0,75. A da DEFS foi 0,92 para os pacientes e
0,73 para os voluntários.
Quanto aos pontos de corte, na DUFS ficou definido que escores totais maiores
ou iguais a 14,5 correspondem a 'fadiga substancial' (ou presença de fadiga),
segundo a ROC (Área sob a curva = 0,84, p=0,0001); e que escores totais maiores
ou iguais a 12,5 na DEFS correspondem a 'fadiga substancial ao esforço' (ou
presença de fadiga substancial ao esforço), também segundo a ROC (Área sob a
curva = 0,87, p=0,0001).
Houve associação dos escores na DUFS e na DEFS com a classe funcional da
insuficiência cardíaca (Kruskall-Wallis, p=0,000, nos dois casos). O teste de
Bonferroni, aplicado para identificar as contribuições de cada grupo para essa
diferença mostrou que a intensidade de fadiga é maior a medida que sobe a
classe funcional. Os coeficientes de correlação de Spearman entre escores DUFS
ou DEFS e os escores de depressão (IDB) foram rs=0,63 (p=0,00) e rs=0,55
(p=0,00), respectivamente, indicando correlação moderada significativa entre as
variáveis. Houve também associação entre a presença de distúrbio de sono e
intensidade de fadiga (escores DUFS) (Mann-Whitney, p=0,000) e intensidade de
fadiga ao esforço (escore DEFS) (Mann-Whitney, p=0,000).
DISCUSSÃO
Os resultados mostraram que a DUFS e a DEFS, escalas para avaliar a fadiga e a
fadiga ao esforço, adaptadas para a língua portuguesa, podem ser usadas para
avaliar grupos de pacientes na clínica e em pesquisas. As estimativas de
validade e confiabilidade feitas em amostra de pacientes com insuficiência
cardíaca e voluntários sem a doença mostraram resultados muito bons ou
moderados.
A melhor solução da análise fatorial mostrou os itens 6 e 7 da DUFS com carga
fatorial maior no fator correspondente à DEFS (Tabela_1). Esses itens referem-
se, respectivamente, à percepção do indivíduo quanto a conseguir fazer as
atividades do dia-a-dia e quanto ao interesse por manter relações sexuais, o
que evoca aspectos de esforço físico. Talvez esse tenha sido o motivo por eles
terem ficado com carga fatorial mais alta no fator que agrupou os itens
provenientes da DEFS.
Os resultados da fatorial sugeriram a mudança dos itens 6 e 7 da DUFS para a
DEFS. No entanto, os resultados de análise da confiabilidade dos instrumentos
auxiliaram na decisão de manter a estrutura original das escalas. Observa-se na
Tabela_2 (confiabilidade da DUFS) que a exclusão do item 6 provocaria
diminuição da confiabilidade (de 0,848 para 0,835), o que não seria
interessante; e que a exclusão do item 7 aumentaria o alfa de 0,848 para 0,859,
o que não é aumento substancial. Além disso, a inclusão dos itens 6 e 7 na DEFS
diminuiria o seu alfa de 0,922 para 0,910. Como essas alterações não
melhorariam substancialmente a confiabilidade das escalas, decidiu-se manter a
estrutura original das mesmas, também para permitir comparação com outros
estudos.
Até o momento da elaboração deste artigo não se dispunha de relatos detalhados
sobre a estrutura fatorial da DUFS e DEFS. A informação disponível era de que
ambas têm apenas uma dimensão(26), o que foi reproduzido com a versão
brasileira.
A confiabilidade da versão brasileira da DUFS na amostra total foi boa (alfa =
0,848) (Tabela_2) e a da DEFS foi muito boa (alfa = 0,922) (Tabela_3). O
comportamento dos itens nas estimativas para pacientes e voluntários,
separadamente, foi semelhante ao obtido para os dados do conjunto dos
participantes no estudo. As escalas apresentaram confiabilidades muito boas ou
boas no grupo de pacientes e de voluntários. Todos os itens foram mantidos na
DUFS e na DEFS.
Quanto à validade das escalas, as três hipóteses testadas foram confirmadas.
Partiu-se dos pressupostos teóricos de que a fadiga é mais intensa nas classes
funcionais mais elevadas da insuficiência cardíaca, quando os escores de
depressão são mais elevados e quando há distúrbio do sono. Esses resultados
foram semelhantes aos encontrados com as escalas no ambiente em que foram
criadas(26).
Um aspecto que merece destaque é que não há definição para as escalas originais
sobre o cálculo dos escores finais de cada respondente. Eles podem variar, na
DUFS e na DEFS, de 1 a 5 se o escore final for a média aritmética dos escores
em cada item. Se o escore final for a soma dos escores nos itens, na DUFS eles
poderão variar de 8 a 40, e na DEFS de 9 a 45. Para que os resultados entre
estudos possam ser comparáveis recomenda-se a transformação dos escores finais
de todas as escalas para uma variação de 0 a 100.
CONCLUSÃO
O estudo aqui relatado permitiu criar a Dutch Fatigue Scale - Versão Brasileira
e a Dutch Exertion Fatigue Scale - Versão Brasileira com boas propriedades
psicométricas e desempenho semelhante ao do instrumento original(26).
As duas escalas de fadiga poderão ser testadas em outras amostras de pacientes
e em estudos de população geral. Conhecer o comportamento da fadiga em
população geral, com instrumentação semelhante a que é usada com pacientes é
importante para refinar as interpretações que são feitas sobre a prevalência e
magnitude dessa resposta em amostras com diversas condições agudas e crônicas.
Instrumentos padronizados para avaliar diagnósticos de enfermagem, como a
fadiga, são úteis também para pesquisas de refinamento dos diagnósticos. Tais
instrumentos permitem operacionalizar os conceitos diagnósticos de modo
reprodutível, aumentando a confiabilidade dos estudos em que esses conceitos
são investigados.