Avaliação da simulação ou esforço insuficiente com o Rey 15-Item Memory Test
(15-IMT): Estudos de validação em grupos de adultos idosos
INTRODUÇÃO
A credibilidade das queixas envolvendo funções cognitivas como a memória
encontra-se entre os problemas mais comuns e difíceis de identificar na
avaliação neuropsicológica em contexto forense. Neste âmbito, os resultados nos
testes são habitualmente considerados como tendo um valor de evidência
objectiva da validade dos sintomas cognitivos comunicados (défices ou declínio
da memória, atenção, concentração, etc.) e dos seus efeitos funcionais nos
comportamentos, desempenhos e actividades da vida diária. Contudo, os baixos
resultados nos testes neuropsicológicos podem ser explicados por razões que não
a presença de défices cognitivos, lesão ou disfunção cerebral. A motivação
reduzida, o esforço incompleto/insuficiente ou mesmo a simulação (malingering),
correspondem a "estilos de resposta" que podem explicar desempenhos
problemáticos ou resultados inferiores nos testes neuropsicológicos.
O termo simulaçãoé definido pelo Manual de Diagnóstico e Estatística dos
Distúrbios Mentais (DSM-IV) como a "produção intencional de sintomas
físicos ou psicológicos, falsos ou exagerados, motivados por incentivos
externos" (DSM-IV-TR; APA, 2002, p. 739), estando patentes nesta
definição três elementos fundamentais: invenção ou exagero de sintomas,
motivação ou intenção consciente do sujeito para simular e presença de
incentivos externos. Por outro lado, são vários os autores que advertem para a
necessidade de se conceptualizar os comportamentos de simulaçãonum continuum
(cf. por exemplo, Bush, Ruff, Troster, Barth, Koffler, et al., 2005; Larrabee,
2005). Slick, Sherman, e Iverson (1999) apontam, neste âmbito, critérios de
diagnóstico, em parte sobreponíveis ao apontado pela DSM-IV-TR, para Simulação
de Perturbação Neurocognitiva Possível, Provável e Definitiva, que incluem:
presença de incentivos externos substanciais, evidências nos resultados em
testes neuropsicológicos, indícios de exagero de sintomas no auto-relato do
sujeito, não devendo estes comportamentos de simulaçãoser melhor explicados por
doença psiquiátrica, neurológica ou desenvolvimental (para uma redefinição do
contributo dos testes psicométricos para o diagnóstico de Simulação de
Perturbação Neuro-cognitiva Provável, cf. Larrabee, Greiffenstein, Greve, &
Bianchini, 2007).
Existe uma evidência crescente da presença frequente de simulação(ou esforço
insuficiente) nos desempenhos nos testes em pessoas que se encontram numa
situação de litígio. Os ganhos secundários (incluindo incentivos de natureza
financeira, redução de penas, alteração nas condições de trabalho, acesso a
fármacos) podem desempenhar um papel relevante nestes casos (cf. por exemplo,
Kitchen, 2003). Exemplos destas situações incluem o caso da avaliação da
competência para testemunhar em contexto criminal, o exame das sequelas de
traumatismo crânio-encefálico resultante de acidente de viação ou de trabalho,
as consequências de práticas médicas incorrectas, os pedidos de reforma
antecipada, em que as pessoas, incluindo adultos idosos, podem estar motivadas
para simularou fingira presença de problemas mnésicos que constituem sintomas
característicos de lesão, demência ou declínio cognitivo.
Atendendo à possibilidade de distorções na objectividade das respostas e
desempenho individuais, que introduzem maior complexidade nos processos de
avaliação neuropsicológica (Rogers, 1997), é facilmente compreensível a
necessidade de examinar, de modo sistemático, a credibilidade das queixas de
dificuldades cognitivas (ou dos sintomas de perturbação mental) e identificar
os casos de desempenhos deficitários associados a incentivos externos, casos de
incompatibilidade entre "doença e défices observados" e/ou de
"inconsistência entre desempenhos ou comportamentos observados e a
gravidade da lesão".
O exame da simulaçãoou do esforço insuficienteconstitui uma área de
investigação e prática profissional em neuropsicologia, com desenvolvimentos
importantes nas últimas duas décadas que se encontram recenseados em
publicações específicas recentes (cf. por exemplo, Boone, 2007; Larrabee, 2007;
Morgan & Sweet, 2009; Rogers, 2008). Apesar de constituir presentemente uma
das áreas de maior crescimento no domínio da neuropsicologia forense, em
Portugal é ainda muito rara a investigação com testes especificamente
desenvolvidos para examinar a credibilidade das queixas e dos desempenhos
cognitivos.
Este tipo de exame deve alicerçar-se no uso de vários testes. Neste contexto, a
análise dos padrões de resposta (cf. Tombaugh, 2002) a instrumentos mais
"clássicos" de avaliação neuropsicológica (por exemplo, WAIS-III,
WMS-III, Trail Making Test) é uma das opções consideradas (para uma revisão,
cf. Boone, 2007; Larrabee, 2007; Simões, 2005). Contudo, sabe-se que os testes
neuropsicológicos tradicionais são menos objectivos na identificação destes
"estilos de resposta" ou para confirmar se os sintomas são reais (e
não exagerados ou fingidos), radicando também nesta limitação o desenvolvimento
recente de testes específicos, de escolha forçada, os denominados Testes de
Validade de Sintomas.
Reconhece-se actualmente que os testes de avaliação da validade de sintomas
devem ser administrados não apenas em situações de litígio, nos casos em que a
motivação pode ser problemática, quando surgem sintomas raros ou não credíveis
formulados para obter simpatia ou atenção da família ou de outras pessoas
significativas mas, igualmente, e de modo sistemático, em qualquer processo de
avaliação (cf. por exemplo, Slick, Tan, Strauss, & Hultsch, 2004). A
utilização de mais do que um teste especificamente construído para examinar a
validade dos desempenhos constitui, presentemente, uma prática comum e
representa um avanço importante na validação dos protocolos de exame
neuropsicológico (Simões, 2006; Slick et al., 1999).
O Rey 15-Item Memory Test(15-IMT; Rey, 1964) é um dos instrumentos mais usados
(Rabin, Barr, & Burton, 2005; Slick et al., 2004; Strauss, Sherman, &
Spreen, 2006) para detectar a simulaçãode défices ou declínio mnésico (Reznek,
2005) ou o esforço insuficiente(Slick et al., 1999), com estudos em contexto
forense/ /criminal envolvendo sujeitos considerados simuladores (ou suspeitos
de simulação) institucionalizados em estabelecimentos prisionais (por exemplo,
Frederick, Sarfaty, Johnston, & Powel, 1994; King, 1992; Simon, 1994). São
várias as investigações empíricas que sugerem um desempenho mais pobre no 15-
IMT por parte de indivíduos com incentivos externos para parecerem
"incapacitados", por comparação com indivíduos que não têm esses
incentivos (cf. por exemplo, Griffin, Normington, & Glassmire, 1996; Lee,
Loring, & Martin, 1992).
O 15-IMT foi desenvolvido para avaliar a validade das queixas de memória visual
imediata (Nitch & Glassmire, 2007) e da atenção (Heinze, 2003), com base no
"princípio do efeito de tecto" (Rogers, Harrell, & Liff, 1993).
Apesar da tarefa de retenção dos 15 itens exceder, aparentemente, a capacidade
de memória a curto prazo (7±2 itens; Miller, 1956), na realidade, o 15-IMT
apenas requer a memorização de cinco unidades, uma vez que os referidos 15
itens podem ser agrupados em cinco categorias conceptuais. No entanto, o teste
é apresentado explicitamente ao examinando como uma tarefa de memorização de 15
elementos diferentes, fazendo-a parecer mais difícil do que é na realidade
(Nitch & Glassmire, 2007). Ou seja, trata-se de uma prova de tal modo
simples que qualquer pessoa que não esteja significantemente deteriorada pode
realizar facilmente (Lezak, Howieson, & Loring, 2004).
A identificação dos pontos de corte sugestivos de simulaçãoou esforço
reduzidoconstitui uma tarefa essencial para a interpretação dos resultados no
teste. Nesta base, para o 15-IMT têm sido propostos diferentes pontos de corte,
considerando a pontuação no Ensaio de Evocação Imediata: 9 (por exemplo,
Goldberg & Miller, 1986); 8 (Bernard & Fowler, 1990); 7 (por exemplo,
Lee, Baker, & Gola, 1992); 6 (Arnett, Hammeke, & Schwartz, 1995).
Outros investigadores recomendam pontos de corte mais elevados: 10
(Greiffenstein et al., 1996) ou mesmo 14 (DiCarlo, Gfeller, & Drury,
citados em Frederick, 2002).
São várias as vantagens atribuídas ao 15-IMT. Por um lado, o baixo custo, a
administração fácil e rápida, a possibilidade de usar vários índices ou
resultados quantitativos e as análises de natureza qualitativa (perseverações,
omissões, erros reversíveis) (cf. por exemplo, Lee, Boone, Lesser, Wohl,
Wilkins, & Parks, 2000; Marshall & Happe, 2007). Por outro lado, os
dados da investigação apontam para valores de especificidade
1
elevados (superiores a 95%) em variadas amostras, tais como em pacientes com
lesão cerebral severa (Taylor, Kreutzer, & West, 2003) ou de diferentes
etiologias (Arnett, Hammeke, & Schwartz, 1995), pessoas idosas com
Depressão grave (Lee et al., 2000), doentes com Traumatismo Crânio-Encefálico
moderado e severo (Millis & Kler, 1995), pacientes com Epilepsia do Lobo
Temporal e outras perturbações neurológicas (Lee, Loring, & Martin, 1992).
Evidenciados noutras pesquisas, os limites apontados a este teste residem
principalmente na falta de sensibilidade (cf. por exemplo, Guilmette, Hart,
Giuliano, & Leininger, 1994; Rogers et al., 1993; Vickery, Berry, Inman,
Harris, & Orey, 2001). Num número mais reduzido de pesquisas são também
identificados problemas quanto à especificidade dos resultados (Griffin et al.,
1996; Guilmette et al., 1994; Schretlen, Brandt, Krafft, & Van Garp, 1991).
O 15-IMT foi recentemente objecto de um importante aperfeiçoamento com a
introdução adicional de um Ensaio de Reconhecimento (Boone, Salazar, Lu,
Warner-Chacon, & Razani, 2002) ao formato inicial de administração (Ensaio
de Evocação Imediata, também denominado Ensaio de Evocação Livre).
As tarefas de Reconhecimento providenciam pistas que ajudam o examinando a
recordar a informação apresentada previamente e são mais fáceis do que as
tarefas de Evocação Livre. De modo particular, o reconhecimento visual tem sido
apontado como uma capacidade preservada em pacientes com amnésia e com
traumatismo crânio encefálico (Tombaugh, 1997). No entanto, as pessoas podem
ter uma concepção errada de que as tarefas de Reconhecimento e de Evocação
Livre são de igual nível de dificuldade (Nitch & Glassmire, 2007). Este
facto explica a razão pela qual os simuladores apresentam desempenhos mais
reduzidos nas tarefas de Reconhecimento do que pacientes reais (por exemplo,
Greiffenstein, Baker, & Gola, 1996). Neste sentido, os paradigmas de
Memória de Reconhecimento têm mostrado grande utilidade no exame de sintomas
cognitivos não credíveis (Greiffenstein et al., 1996).
A introdução do Ensaio de Reconhecimento como tarefa integrante do 15-IMT veio
possibilitar a identificação, com um grau de certeza "provável", do
esforço suspeito (definido com base na classificação correcta de 75% de
sujeitos) e, nesta medida, supera uma das limitações identificadas por
Vallabhajosula e Van Gorp (2001) relativa ao não preenchimento do critério de
evidência de admissibilidade científica em tribunal (normas de Daubert). De
recordar que o recurso restrito ao Ensaio de Evocação Imediata (que constitui o
formato original do teste) apresenta uma utilidade reduzida na classificação
dos sujeitos em contexto forense (cf. Etcoff & Kampfer, 1996).
O exame da simulaçãoou do esforço insuficientefaz habitualmente parte
integrante do processo de avaliação neuropsicológica forense e requer o uso de
testes, com estudos de validação efectuados em diferentes grupos clínicos. No
entanto, os grupos de adultos idosos com Declínio Cognitivo Ligeiro ou Demência
são habitualmente excluídos das amostras de validação dos testes de esforço
reduzido, incluindo os estudos que recorrem a amostras clínicas mistas. Como
referem Boone e colaboradores (2002), a exclusão de pacientes com demência (ou
deficiência mental) dos grupos clínicos estudados permite melhorar os valores
de especificidade do teste. Contudo, é necessário admitir que os grupos
clínicos de adultos idosos examinados em contexto forense manifestam
frequentemente défices cognitivos e podem não apresentar os mesmos desempenhos
dos adultos ou mesmo de adultos idosos sem problemas clínicos, pelo que é
imperativo examinar e, eventualmente, ajustar os respectivos pontos de corte.
De facto, Van Gorp e Hassenstab (2009) reconhecem que, apesar do 15-IMT ser
considerado pela maioria das pessoas como um teste fácil, estes métodos
baseados no efeito de tecto podem não resultar do mesmo modo, por exemplo, com
pessoas com doença mental severa ou demência. Daí a necessidade de examinar os
perfis de desempenho em adultos idosos com e sem perturbação neurológica e/ou
psiquiátrica, bem como proceder à análise da adequabilidade dos pontos de corte
habitualmente referenciados na investigação publicada.
Com o presente estudo inicia-se este processo de validação do 15-IMT para a
população portuguesa. Por um lado, examina-se a utilidade dos resultados no
teste em grupos clínicos de adultos idosos que são crescentemente objecto de
investigação em contexto forense (cf. por exemplo, Delgado-Losada, Rodríguez-
Aizcorbe, & Fernández-Guinea, 2001; Simões & Sousa, 2008; Sousa,
Simões, & Firmino, 2009). Especificamente, perturbações psicopatológicas
(como a Depressão) ou neurocognitivas (como o Declínio Cognitivo Ligeiro e a
Demência) são exemplos de problemas clínicos comuns que podem tornar-se objecto
de litígio formal ou envolver algum contexto de ganho secundário, associado,
por exemplo, à determinação de incapacidade e a pedidos de antecipação da
reforma.
Assim, com este trabalho pretende-se examinar a validade e utilidade clínicas
do 15-IMT em grupos de adultos predominantemente idosos da comunidade e
seguidos em consulta externa devido a problemas cognitivos e/ou emocionais.
Para melhor compreender o perfil de desempenho destes grupos no teste foi
também considerado um grupo de jovens adultos, sem qualquer tipo de condição
clínica, a funcionar como grupo de controlo. Especificamente, considerar-se-ão,
em termos de análise, os seguintes tópicos:
I) Análise dos desempenhos no teste por parte dos grupos de adultos
predominantemente idosos da comunidade (Saudáveis), com Problemas Cognitivos
[Declínio Cognitivo Ligeiro (DCL) e Demência Ligeira] ou com diagnóstico de
Depressão, em comparação com os resultados obtidos pelo grupo de Controlo
(jovens adultos);
II) Influência das variáveis demográficas idade, anos de escolaridade e género
nos resultados no teste (para cada um dos grupos em estudo);
III) Análise das inter-correlações entre os vários indicadores do teste (para
os vários grupos);
IV) Relação com medidas do funcionamento cognitivo e emocional, incluindo-se
aqui a análise das correlações entre o desempenho no 15-IMT e os resultados nos
seguintes instrumentos: Exame Breve do Estado Mental (MMSE), Escala de
Depressão Geriátrica (GDS-30), Vocabulário (WAIS-III) e Localização Espacial
(WMS-III) (para os três grupos de adultos predominantemente idosos);
V) Análise crítica dos pontos de corte referenciados na literatura, quer para o
Ensaio de Evocação Imediata, quer para o Ensaio de Reconhecimento (Resultado
Combinado).
MÉTODO
Amostra
As amostras do presente trabalho encontram-se caracterizadas na Tabela 1, sendo
constituídas por um grupo de 104 jovens adultos, com idades compreendidas entre
os 22 e os 35 anos (grupo Controlo); por um grupo de adultos predominantemente
idosos, de 116 sujeitos, com idades compreendidas entre os 55 e os 86 anos.
Mais especificamente, neste grupo de sujeitos, 46 têm diagnóstico psiquiátrico
de Depressão, 37 apresentam diagnóstico de Declínio Cognitivo Ligeiro ou
Demência Ligeira (grupo denominado por "Problemas Cognitivos"). O
grupo da comunidade (Saudável) é composto por 33 sujeitos sem qualquer
patologia psiquiátrica e/ou neurológica. Para estes grupos são igualmente
apontados na Tabela 1 os resultados no MMSE, na GDS-30, nos testes Vocabulário
e Localização Espacial. Não existem dados disponíveis para todos os sujeitos do
grupo da comunidade relativamente a estas duas últimas provas.
TABELA 1
Médias, desvios-padrão, amplitudes e/ou frequências para as variáveis
demográficasconsiderando os vários grupos examinados: Adultos predominantemente
idosos e jovens adultos
Instrumentos
Rey 15-Item Memory Test(15-IMT; Rey, 1964): instrumento construído para avaliar
a validade de queixas relativas a problemas de memória. Consiste num cartão com
15 itens (5 linhas com 3 caracteres cada), apresentado ao examinando durante 10
segundos, após os quais o cartão é removido e, de imediato, pedido para
reproduzir o máximo dos 15 itens que conseguir recordar (Ensaio de Evocação
Livre Imediata). Boone e colaboradores (2002) desenvolveram um Ensaio de
Reconhecimento que consiste na apresentação, após a administração do Ensaio de
Evocação Imediata, dos 15 itens do cartão estímulo original e 15 distractivos,
semelhantes aos itens do cartão inicial. Para além da consideração do número
total de itens que foram correctamente reproduzidos (independentemente da sua
localização espacial) no Ensaio de Evocação Imediata, os indicadores relativos
ao Ensaio de Reconhecimento contemplam: (1) o número de itens correctamente
identificados/ /reconhecidos; (2) o número de falsos positivos (itens
incorrectamente assinalados); e (3) a pontuação combinada [Resultado Combinado
do Reconhecimento = número itens correctamente evocados + (número de itens
correctamente reconhecidos - número de falsos positivos)].
Exame Breve do Estado Mental (Mini Mental State Examination, MMSE; Folstein,
Folstein, & McHugh, 1975; Guerreiro et al., citados em GEECD, 2008):
instrumento de rastreio para uma avaliação breve da Demência. É constituído por
uma série de questões e tarefas que permitem a avaliação das seguintes funções
cognitivas: orientação (10 pontos), repetição (3 pontos), atenção e cálculo (5
pontos), memória (3 pontos) e linguagem (9 pontos). De acordo com os pontos de
corte estabelecidos para a população portuguesa, consideram-se com
"défice cognitivo" os analfabetos com pontuação igual ou inferior a
15, os indivíduos com 1 a 11 anos de escolaridade com pontuação igual ou
inferior a 22, e os indivíduos com escolaridade superior a 11 anos com
pontuação igual ou inferior a 27 (Guerreiro, 1998).
Escala de Depressão Geriátrica - 30 itens (Geriatric Depression
Scale,GDS-30; Andrade, 2007; Barreto, Leuschner, Santos, & Sobral, citados
em GEECD, 2008; Yesavage, Brink, Rose, Lum, Huang, Adey, & Leirer, 1983):
instrumento breve de auto-resposta, especificamente construído para avaliar a
sintomatologia depressiva na população geriátrica. A versão utilizada é
constituída por 30 questões (resposta do tipo sim/não), cotadas com 1 ou 0
pontos, consoante esta indique, respectivamente, a presença ou ausência de um
sintoma depressivo, podendo a pontuação total variar entre 0 e 30 pontos (os
resultados mais elevados são indicativos de maior gravidade dos sintomas). Uma
pontuação entre 0 e 10 traduz "ausência de depressão", entre 11 e
20 indica "depressão ligeira" e, no intervalo entre 21 e 30 sugere
a presença de "depressão grave".
Vocabulário (WAIS-III; Wechsler, 2008a): tarefa que envolve a capacidade para
expressar ideias por palavras. Avalia a capacidade intelectual verbal, sendo
considerado um bom indicador de inteligência cristalizada e, desta forma, das
aptidões pré-mórbidas. Nesta tarefa é pedido ao sujeito para definir oralmente
um conjunto de palavras (por ordem de dificuldade crescente) que o examinador
lê em voz alta, ao mesmo tempo que as apresenta impressas num cartão. As
respostas são cotadas com 2, 1 ou 0 pontos, sendo que o resultado total oscila
entre 0 e 66 pontos. Estes resultados brutos são, posteriormente, convertidos
em resultados padronizados de acordo com a idade dos sujeitos.
Localização Espacial (WMS-III; Wechsler, 2008b): o teste é uma variação do
Tabuleiro de Corsi, construído por analogia ao teste não verbal da memória de
dígitos, sendo considerada uma medida de memória de trabalho visuo-espacial. A
tarefa consiste na apresentação de sequências (por dificuldade crescente) de
toques do dedo indicador, realizados pelo examinador num tabuleiro com 10
cubos. Após a apresentação de cada sequência, o sujeito deverá repeti-la na
mesma ordem pela qual foi apresentada (sentido directo) ou em sentido contrário
(sentido inverso), sendo atribuído 1 ponto por cada sequência correctamente
reproduzida. Estes resultados brutos são, posteriormente, convertidos em
resultados padronizados de acordo com a idade dos sujeitos.
Procedimento
O grupo de jovens adultos é constituído por sujeitos de um curso de formação de
Sargentos da GNR. Deste grupo estão excluídos casos com história de problemas
neurológicos e/ou psiquiátricos, identificados com base nos dados de uma
entrevista estruturada.
O grupo de adultos predominantemente idosos foi examinado no âmbito da Consulta
de Gerontopsiquiatria dos Hospitais da Universidade de Coimbra, em Centros de
Dia e na Comunidade. Os diagnósticos clínicos de DCL, Demência Ligeira e
Depressão foram efectuados por um médico psiquiatra. Nestes grupos, o 15-IMT
foi administrado no âmbito de um protocolo de avaliação neuropsicológica mais
exaustivo, do qual fazem parte as provas referidas anteriormente e que são
também objecto de análise no presente estudo. Desta forma, o MMSE e a GDS foram
utilizados, respectivamente, como medidas de rastreio cognitivo e de
sintomatologia depressiva, domínios essenciais na investigação envolvendo
adultos idosos. O teste Vocabulário da WAIS-III foi administrado com o
objectivo de obter um indicador de capacidade intelectual verbal. Finalmente, e
considerando que o 15-IMT foi desenvolvido como uma prova de memória visual, o
teste Localização Espacial da WMS-III foi incluído no protocolo de avaliação
com a finalidade de ter uma outra medida de memória visual.
O Ensaio de Evocação Imediata do 15-IMT foi administrado antes da tarefa de
Reconhecimento. Para o Ensaio de Reconhecimento foram calculados o número de
itens correctamente identificados como pertencendo ao estímulo inicial, o
número de itens incorrectamente apontados (falsos positivos, na terminologia de
Boone et al., 2002; falsos alarmes, na conceptualização da Teoria de Detecção
de Sinal) e o Resultado Combinado do Reconhecimento.
As análises estatísticas foram efectuadas com o auxílio do programa Statistical
Package for the Social Sciences(SPSS - versão 15.0). Na comparação dos
desempenhos entre os vários grupos em estudo foram utilizadas a One-way ANOVA
com post hocde Sheffe (comparação dos 4 grupos em estudo) e o U de Mann-Whitney
(comparação dos subgrupos com problemas de natureza cognitiva: DCL e Demência
Ligeira). Para a análise do grau de associação entre diversas variáveis e/ou
indicadores de desempenho foram empregues os coeficientes de correlação de
Pearson.
RESULTADOS
Análise dos desempenhos no teste por parte dos grupos de adultos
predominantemente idosos e grupo de jovens adultos
Os resultados obtidos no 15-IMT pelos três grupos de adultos predominantemente
idosos (Saudáveis, Depressão e Problemas Cognitivos), equiparados quanto às
variáveis idade e escolaridade, e pelo grupo de jovens adultos (Controlo) foram
comparados, no sentido de averiguar se os grupos apresentam desempenhos
distintos. Os resultados são apresentados na Tabela 2.
TABELA 2
Médias, desvios-padrão e amplitudes dos resultados no 15-IMT para os grupos em
estudo
Foram observadas diferenças com significado estatístico entre os grupos em
todos os indicadores do 15-IMT analisados: nº de itens correctamente evocados
[F(3,212)=76.766; p<.01]; nº de itens correctamente reconhecidos [F
(3,212)=62.802; p<.01]; nº de falsos positivos [F(3,212)=38.483; p<.01] e
Resultado Combinado do Reconhecimento [F(3,212)=99.768; p<.01]. Pelas análises
de post hoc, verifica-se que o grupo de jovens adultos (Controlo) apresenta
desempenhos significativamente superiores relativamente aos restantes grupos
(p<.01) em todos os indicadores do 15-IMT. Já o grupo de adultos
predominantemente idosos com Problemas Cognitivos é o que apresenta pontuações
significativamente inferiores aos demais grupos, com excepção do verificado no
número de itens correctamente identificados no Ensaio de Reconhecimento, onde
os resultados não diferem dos alcançados pelo grupo de idosos com diagnóstico
de Depressão (p>.05). Salienta-se ainda a inexistência de diferenças com
significado estatístico entre os grupos de adultos predominantemente idosos com
Depressão e Saudáveis no número de Falsos Positivos e Resultado Combinado do
Reconhecimento (p>.05).
No grupo com problemas de natureza cognitiva, foi comparado o desempenho no 15-
IMT dos subgrupos de sujeitos com diagnósticos de DCL (n=18; 5 homens e 13
mulheres; Idade: 68.44±7.95) e Demência Ligeira (n=19; 9 homens e 10 mulheres;
Idade: 70.89±9.57). Os sujeitos pertencentes a estes dois grupos têm, na sua
maioria, o primeiro ciclo do ensino básico em termos de escolaridade e são
equiparáveis quanto às variáveis demográficas.
Estes dois subgrupos diferiram de forma estatisticamente significativa na
pontuação obtida no Ensaio de Evocação Imediata (U=98.500; p=.026) e no
Resultado Combinado do Reconhecimento (U=96.500; p=.022), com o grupo de DCL a
obter uma pontuação superior ao grupo de Demência Ligeira (Evocação Imediata:
DCL=9.39±3.45; Demência=6.74±3.77; Resultado Combinado do Reconhecimento:
DCL=17.06±6.94; Demência= 11.58±6.72). Apesar de se observar um desempenho
ligeiramente superior por parte do grupo com DCL relativamente ao grupo com
Demência Ligeira nos restantes indicadores (número de itens correctamente
reconhecidos e número de falsos positivos), as diferenças não revelaram
significado estatístico (p>.05).
Efeito das variáveis demográficas
Considerando as diferenças de desempenho aludidas anteriormente, o impacto das
variáveis idade, escolaridade e género foi examinado em cada um dos grupos em
estudo para os principais indicadores passíveis de ser obtidos no 15-IMT.
A idade apenas demonstrou ter um impacto negativo no número de itens
reproduzidos no Ensaio de Evocação Imediata (r=-.344; p<.01), especificamente
no grupo com Problemas Cognitivos. Pela comparação das pontuações no 15-IMT
obtidas pelos sujeitos em cada grupo de escolaridade considerado, não se
reportaram diferenças com significado estatístico em nenhum dos grupos
amostrais analisados (p>.05). Finalmente, no que diz respeito à variável
género, apenas se observaram diferenças significativas no grupo com Problemas
Cognitivos, tendo sido observado um desempenho superior das mulheres por
comparação com os homens, no Ensaio de Evocação Imediata (U=86.000; p=.018) e
no Resultado Combinado do Reconhecimento (U=87.500; p=.020).
Inter-correlações
Foram calculadas as inter-correlações entre os vários indicadores passíveis de
ser obtidos com o 15-IMT, para cada um dos grupos em análise.
Pela análise da Tabela 3, constata-se que em todos os grupos considerados é
evidente a tendência para associações com significado estatístico entre o
Resultado Combinado do Reconhecimento e a pontuação obtida no Ensaio de
Evocação Imediata, sendo mais elevadas nos grupos de adultos predominantemente
idosos (Problemas Cognitivos: r=.875, p<.01; Depressão: r=.916, p<.01;
Saudáveis: r=.960, p<.01) por comparação ao grupo de jovens adultos (r=.739;
p<.01). O Resultado Combinado do Reconhecimento revela-se ainda
significativamente associado ao número de itens correctamente identificados no
Ensaio de Reconhecimento (Problemas Cognitivos: r=.818, p<.01; Depressão:
r=.907, p<.01; Saudáveis: r=.950, p<.01), mantendo-se a anterior tendência para
valores mais baixos no grupo de jovens adultos (r=.636; p<.01), sendo que neste
grupo (r=-.467; p<.01), no grupo de adultos predominantemente idosos Saudáveis
(r=-.549; p<.01) e com Depressão (r=-.464; p<.01) foram também encontrados
coeficientes de correlação significativos com o número de falsos positivos. Se
atendermos à fórmula de cálculo do Resultado Combinado do Reconhecimento
[número de itens evocados + (número de itens reconhecidos - falsos
positivos); Boone et al., 2002], estes coeficientes de correlação positivos com
o número de itens evocados e o número de itens reconhecidos, e negativos com o
número de falsos positivos, são facilmente apreendidos.
Nos três grupos de adultos predominantemente idosos, e contrariamente ao
encontrado no grupo de jovens adultos, observam-se associações significativas
entre o número de itens reproduzidos no Ensaio de Evocação Imediata e o número
de itens correctamente identificados no Ensaio de Reconhecimento, com
coeficientes de correlação de .564 no grupo com Problemas Cognitivos, .738 no
grupo com Depressão e .873 no grupo Controlo (todos com p<.01).
TABELA 3
Inter-correlações entre os indicadores do 15-IMT, para cada um dos grupos em
estudo
Relação com medidas do funcionamentocognitivo e emocional
A Tabela 4 apresenta os coeficientes de correlação entre as pontuações nos
indicadores do 15-IMT e o desempenho em outras provas, nomeadamente no MMSE,
GDS, Vocabulário e Teste de Localização Espacial. Esta análise foi efectuada
para os três grupos de adultos predominantemente idosos (Saudáveis, Depressão e
Problemas Cognitivos).
De um modo geral, é nos grupos de sujeitos com diagnóstico de Depressão e sem
condição neurológica ou psiquiátrica (Saudáveis) que se observam os
coeficientes de correlação estatisticamente significativos.
No grupo com Depressão observam-se associações com significado estatístico
entre todos os indicadores do 15-IMT e os resultados no MMSE (itens evocados:
r=.522, p<.01; itens reconhecidos: r=.613, p<.01; falsos positivos: r=-.353,
p<.01; Resultado Combinado do Reconhecimento: r=.606, p<.01), bem como com os
resultados no Teste de Localização Espacial (itens evocados: r=.381, p<.01;
itens reconhecidos: r=.420, p<.01; falsos positivos: r=-.371, p<.01; Resultado
Combinado do Reconhecimento: r=.468, p<.01) e, ainda, entre a pontuação na
Evocação Imediata e o resultado no Vocabulário (r=.371; p<.05). No grupo de
adultos predominantemente idosos Saudáveis verificam-se também coeficientes de
correlação significativos entre todos os indicadores e o MMSE (itens evocados:
r=.527, p<.01; itens reconhecidos: r=.497, p<.01; falsos positivos: r=-.522,
p<.01; Resultado Combinado do Reconhecimento: r=.563, p<.01), sendo observada
uma associação estatisticamente significativa entre os falsos positivos e o
desempenho no teste de Localização Espacial (r=-.665; p<.01).
TABELA 4
Coeficientes de correlação entre os resultados nos vários indicadores do 15-
IMTe pontuações no MMSE, Vocabulário, GDS e localização espacial,para os três
grupos de adultos predominantemente idosos
Análise crítica dos pontos de corte
Para cada um dos grupos em estudo foi calculada a percentagem de sujeitos com
pontuação inferior aos pontos de corte mais comummente apontados na literatura
para o 15-IMT: <9 para o Ensaio de Evocação Imediata e <20 para o Resultado
Combinado do Ensaio de Reconhecimento.
No grupo com Problemas Cognitivos, 51.4% dos sujeitos pontuaram abaixo do ponto
de corte para o Ensaio de Evocação Imediata e 78.4% no Reconhecimento. No grupo
com Depressão, estes valores percentuais desceram para 29.3% na Evocação
Imediata e 43.5% no Reconhecimento, enquanto no grupo sem condição neurológica
ou psiquiátrica (Saudáveis) 21.2% dos sujeitos reproduziram menos de 9
elementos na Evocação Imediata, sendo que 33.3% pontuaram também abaixo do
ponto de corte no Reconhecimento. Por fim, importa salientar que no grupo de
jovens adultos, nenhum indivíduo pontuou abaixo dos pontos de corte
habitualmente considerados, quer no Ensaio de Evocação Imediata, quer no Ensaio
de Reconhecimento.
É necessário um valor elevado de especificidade para minimizar a ocorrência de
erros falsos positivos. Neste sentido, e para uma análise mais aprofundada, foi
calculada a especificidade de vários pontos de corte apontados na literatura,
para o Ensaio de Evocação Imediata e Resultado Combinado do Reconhecimento
considerando os 4 grupos em estudo. Os resultados são apresentados na Tabela 5.
TABELA 5
Valores de especificidade relativa aos pontos de corte do ensaio de evocação
imediata e do ensaio de reconhecimento, para todos os grupos
Com vista a uma melhor compreensão dos pontos de corte relativos ao Ensaio de
Evocação Imediata e Resultado Combinado do Reconhecimento, foram calculados os
percentis para cada para o um dos grupos. Estes dados são apresentados na
Tabela 6.
TABELA 6
Percentis relativos ao ensaio de evocação imediata e ao ensaio de
reconhecimento,para cada um dos grupos: Adultos predominantemente idosos
(problemas cognitivos, depressão, saudáveis) e controlo (jovens adultos)
Na Evocação Imediata e com base, quer no resultado no Percentil 5 (Tabela 6),
quer nos elementos referidos relativos à especificidade (Tabela 5), o ponto de
corte ≤6 parece apresentar-se como aceitável para os grupos Depressão e
Saudáveis. Quanto ao Resultado Combinado do Reconhecimento, considerando o
Percentil 5, foram observados resultados substancialmente inferiores ao ponto
de corte 20 nos grupos de adultos predominantemente idosos: respectivamente 2
(Problemas Cognitivos); 5.70 (Depressão) e 11.70 (Saudáveis) e uma pontuação
bastante superior (27) no grupo de jovens adultos.
DISCUSSÃO
Os dados obtidos apontam para diferenças de desempenho nos grupos estudados e
são convergentes com o indicado em 1991 por Schretlen e colaboradores
(relativamente ao Ensaio de Evocação Imediata), referindo que os pacientes com
amnésia e défice cognitivo severo causado por variadas condições
neuropsicológicas apresentam um desempenho bastante reduzido no 15-IMT. Embora
superiores aos desempenhos do grupo com Problemas Cognitivos (8,03±3,81), as
pontuações médias observadas no grupo com Depressão (10,40±3,33) foram, ainda
assim, inferiores aos resultados da investigação de Lee e colegas (2000) com
adultos idosos diagnosticados com Depressão severa (12,27±2,76).
A constatação de diferentes perfis de desempenho adverte-nos, por um lado, para
o imperativo de adequar os pontos de corte aos vários grupos que são
especificamente objecto de avaliação e, por outro, para a necessidade de
estudar os desempenhos destes grupos de forma independente.
No que diz respeito ao efeito da idade no desempenho no 15-IMT, os resultados
da investigação publicada são pouco convergentes. Existem alguns estudos a
apontarem a inexistência de um efeito da idade (Boone et al., 2002; Nelson,
Boone, Dueck, Wagener, Lu, & Grills, 2003), enquanto noutros se observa um
efeito significativo desta variável (Schretlen et al., 1991), bem como da
escolaridade (Boone et al., 2002; Nelson et al., 2003). Por outro lado, à
semelhança do constatado por Nelson e colaboradores (2003), no presente
trabalho também não foram encontradas diferenças entre os desempenhos de homens
e mulheres.
Os valores de inter-correlações obtidos são, em parte, convergentes com os
reportados por Boone e colaboradores (2002). Estes investigadores encontraram
também associações significativas entre as pontuações da Evocação Imediata e o
número de itens correctamente assinalados no Ensaio de Reconhecimento (r=.63)
em grupos clínicos, com problemas de aprendizagem e controlo, mas não com os
falsos positivos (à semelhança do observado no presente trabalho, em que a
única excepção é verificada no grupo de adultos predominantemente idosos
Saudáveis, com uma associação negativa de r=-.441; p<.05). Boone e colegas
(2002) referem ainda uma associação significativa entre o número de itens
correctamente reproduzidos e o número de falsos positivos (r=-.34), resultado
replicado no presente trabalho, nos grupos de adultos predominantemente idosos
com Depressão, Saudáveis e Controlo (jovens adultos).
Quanto à relação entre os desempenhos no 15-IMT e as pontuações em outras
provas, os resultados vão ao encontro do reportado em várias pesquisas. Neste
sentido, Schretlen e colaboradores (1991) observaram uma correlação
significativa entre o número de itens evocados e os resultados do MMSE (r=.81;
p<.001) numa amostra heterogénea de pacientes com perturbação mental, amnésia,
demência e outras condições neuropsiquiátricas. Nelson e colaboradores (2003)
obtiveram igualmente correlações estatisticamente significativas com medidas de
avaliação da memória (Figura Complexa de Rey, Warrington Recognition Memory
Test, Memória de Dígitos) numa amostra de 105 pacientes em situação de litígio
ou com pedido de compensação que evidenciavam sintomas não credíveis em testes
psicométricos e critérios comportamentais.
A ausência de associações significativas entre o desempenho no 15-IMT e as
pontuações na GDS traduz a inexistência de um efeito da severidade da
sintomatologia depressiva nos resultados na prova, sendo este dado convergente
com o reportado por Lee e colaboradores (2000) num grupo de idosos com
Depressão. Nesta investigação, os grupos de idosos com depressão ligeira,
moderada e severa (identificados através da Hamilton Depression Rating Scale)
não se diferenciaram no desempenho no 15-IMT, não existindo também correlações
com significado estatístico entre a pontuação nesta escala de avaliação da
sintomatologia depressiva e a pontuação no 15-IMT. Os autores concluíram que o
aumento da severidade da sintomatologia depressiva não tem efeito no desempenho
no 15-IMT, um dado adicional que suporta o uso desta prova.
A anterior constatação de perfis de desempenho diferenciados nos vários grupos
em estudo obriga a uma análise crítica e individual dos pontos de corte.
Neste sentido, e em convergência com as percentagens de adultos
predominantemente idosos a pontuar abaixo dos pontos de corte (quer no Ensaio
de Evocação Imediata, quer no Resultado Combinado do Reconhecimento),
especialmente no grupo com Problemas Cognitivos, estão os resultados do estudo
de Schretlen e colegas (1991), que constataram que muitos sujeitos não
simuladores (pacientes com deficiência mental, demência ou amnésia) pontuam
abaixo do ponto de corte 9 sugerido para a Evocação Imediata. Ou seja,
utilizando o ponto de corte de <9, o 15-IMT apresenta uma especificidade
inaceitável em indivíduos com demência (Schretlen et al., 1991), embora seja
possível apurar, num estudo recente, valores de especificidade mais aceitáveis
(86%) quando os pontos de corte são ajustados para 6 ou menos itens
(D'Arcy & McGlone, 2000).
Com base numa pontuação inferior a 9 na Evocação Imediata, Hurley e Deal (2006)
concluem, no seu estudo, que 80% dos sujeitos com deficiência mental seriam
incorrectamente classificados como estando a "simular", tal como
a. o sucedido com os casos de demência. Contudo,
b. o desempenho do grupo de jovens adultos (nenhum sujeito pontua abaixo do
ponto de corte no Ensaio de Evocação Imediata) acabou por ir ao encontro
das conclusões de Schretlen e colaboradores (1991), segundo as quais
pessoas sem défices cognitivos acentuados, sem doença neurológica
demonstrada ou perturbação mental severa não devem reproduzir menos de 9
elementos no Ensaio de Evocação Imediata.
Tendo em consideração os comentários formulados relativamente às percentagens
de sujeitos incorrectamente classificados como "simuladores", em
casos provenientes de populações clínicas, e reportando aos valores de
especificidade calculados, os dados obtidos convergem com os estudos que
documentam uma baixa especificidade da prova em populações com Demência (Dean,
Victor, Boone, Philpott, & Hess, 2009; Hays, Emmons, Stallings, 2000;
Philpott, 1992; Schretlen et al., 1991) ou outro tipo de défices cognitivos,
como é o caso da Deficiência Mental (Dean, Victor, Boone, & Arnold, 2008;
Goldberg & Miller, 1986; Hurley & Deal, 2006; Marshall & Happe,
2007).
Com base na análise dos percentis ressalva-se que o ponto de corte ≤6 (Ensaio
de Evocação Imediata) parece apresentar-se como aceitável para os grupos
Depressão e Saudáveis, convergindo com propostas apontadas para grupos clínicos
com lesões cerebrais de diferentes etiologias (Arnett et al., 1995), Demência e
perturbações psiquiátricas graves (D'Arcy & McGlone, 2000; Schretlen
et al., 1991), Epilepsia do lobo temporal (Lee et al., 1992), apesar de se
revelar ainda inadequado para o grupo Problemas Cognitivos (DCL e Demência
Ligeira).
Em sentido inverso, no grupo Controlo (jovens adultos), a pontuação de 12
(correspondente ao Percentil 5) mostrou que o ponto de corte habitualmente
proposto (9) pode ser eventualmente pouco sensível, sugerindo a necessidade de
verificar em futuros estudos com outras amostras a recomendação de outros
investigadores que aconselham o recurso a pontos de corte mais elevados (cf.
por exemplo, Greiffenstein, et al., 1996). Os dados do presente estudo estão
igualmente em consonância com a conclusão de Schretlen e colaboradores (1991)
quando referem que, ao contrário do que acontece em adultos normais, e apesar
da sua simplicidade, o teste (especificamente o Ensaio de Evocação Imediata) é
menos afectado por um efeito de tecto quando aplicado em populações clínicas.
Ao desenvolver o Ensaio de Reconhecimento para o 15-IMT, Boone e colaboradores
(2002) procuraram melhorar a sensibilidade do teste mantendo um elevado nível
de especificidade. Com efeito, estes autores concluíram que o uso da Evocação
Imediata combinada com as pontuações obtidas no Ensaio de Reconhecimento
(utilizando o ponto de corte <20) aumenta a sensibilidade da prova de 47% para
71%. Desta forma, o uso do Resultado Combinado em complemento à pontuação única
da Evocação Imediata parece constituir uma abordagem mais eficaz na detecção de
casos de simulaçãoou de esforço insuficiente.
CONCLUSÕES
Para determinar, de modo "definitivo", a natureza não credível do
desempenho é recomendável o recurso a vários testes e indicadores ou índices de
esforço (Bush et al., 2005). O presente estudo deve ser entendido neste âmbito
mais lato de validação de um instrumento que pode vir a integrar,
desejavelmente com outras medidas de exame da simulaçãoou esforço insuficiente,
os protocolos de avaliação neuropsicológica em contexto forense. Neste plano,
convém lembrar igualmente que o exame da validade de um teste corresponde a um
processo contínuo e sistemático de investigação e supõe a realização de vários
estudos com recurso a amostras diversificadas.
Embora sejam necessários mais estudos, os presentes resultados sugerem que os
pontos de corte propostos na literatura, <9 (Ensaio de Evocação Imediata) e <20
(Resultado Combinado do Reconhecimento), parecem ser adequados para o exame dos
comportamentos de simulaçãoou esforço insuficientepor parte de sujeitos adultos
sem problemas clínicos, mas o seu uso não pode ser generalizado a adultos
idosos independentemente da presença ou não de problemas clínicos (deterioração
cognitiva ou depressão). Sob pena de identificar erroneamente muitos sujeitos
destes grupos clínicos como "simuladores" ou como manifestando
"esforço insuficiente", é forçoso ajustar os pontos de corte para
um valor inferior a 9, próximo de 6 (correspondente ao Percentil 5 e a valores
de especificidade superiores a 95%) considerando os resultados no grupo
Saudável e com Depressão, à semelhança do proposto noutras pesquisas. Contudo,
e especificamente para o grupo com Problemas Cognitivos (DCL e Demência
Ligeira), este ajustamento deverá remeter provisoriamente para um valor ainda
mais reduzido. À semelhança do sugerido num estudo recente com o Test of Memory
Malingering(TOMM) (Mota, Simões, Amaral, Dias, Luís, Pedrosa, Maior, &
Silva, 2008), o 15-IMT não é uma medida insensível a formas de declínio ou
défice cognitivo ou mesmo ao nível de funcionamento cognitivo pré-mórbido (cf.
Hays, Emmons, & Lawson, 1993).
De modo complementar, e considerando o valor das correlações positivas entre
medidas do funcionamento cognitivo (inteligência, memória) e os indicadores do
15-IMT, deve ser igualmente reconhecida a importância destas variáveis nos
desempenhos em medidas de exame da simulaçãoou esforço insuficiente. Dito de
outro modo, convém reconhecer que os resultados no 15-IMT são influenciados por
variáveis que não (apenas) o esforço insuficienteou a intenção de
simulardéfices de natureza cognitiva (memória, atenção). Neste contexto, deve
ser reconhecida a possibilidade de níveis inaceitáveis de especificidade
relativamente à probabilidade de simulaçãoou esforço insuficientenum número
muito elevado de pacientes com problemas cognitivos e pertencentes a
determinados grupos clínicos - Demência, Acidente Vascular Cerebral,
défices mnésicos acentuados, Psicose em idade avançada, níveis de inteligência
baixos (QIs inferiores, deficiência mental), baixo nível escolar (cf. Nitch
& Glassmire, 2007) - quando se recorre a valores de pontos de corte
previamente definidos a partir de grupos não clínicos. Ou seja, não é possível
generalizar a casos pertencentes a estes grupos especiais, e que não são aliás
raros, os dados da investigação empírica publicada que conclui que quando se
observam pontuações inferiores a 9 (Ensaio de Evocação), este resultado é
sugestivo da presença de esforço insuficienteou simulação. Esta impossibilidade
de generalização dos resultados, independentemente dos grupos examinados, é
igualmente válida para o ponto de corte do Resultado Combinado do Ensaio de
Reconhecimento.
O recurso ao Ensaio de Reconhecimento poderá aumentar os valores de
sensibilidade desta prova sem sacrificar os parâmetros de especificidade, mas
são igualmente necessários mais estudos de validação para este método
recentemente proposto.
O presente estudo apresenta alguns limites. Neste plano, é necessário referir
que as amostras usadas não apresentavam qualquer evidência de suspeita de
simulação, incentivos externos ou ganhos secundários. Futuros estudos deverão
incluir um grupo de sujeitos suspeitos de simulaçãoou esforço insuficiente(com
motivação para exagerar sintomas), uma vez que o recurso a este tipo de testes
supõe investigação empírica que evidencie que apenas os simuladores
"falham" em tais medidas. Uma outra limitação remete para a
natureza e o tamanho reduzido das amostras clínicas de adultos
predominantemente idosos, bem como para a natureza do grupo de jovens adultos
(amostra de conveniência). Para futuros estudos de natureza normativa, a
amostra de adultos e adultos idosos saudáveis deverá também ser alargada, de
modo a autonomizar melhor o grupo de adultos idosos e sujeitos com idades
compreendidas entre os 45 e os 64 anos de idade.
Alguma investigação necessária para colmatar estas limitações encontra-se
presentemente em curso. Juntamente com outros testes de validade de sintomas
como o TOMM, o 15-IMT é presentemente administrado em protocolos de avaliação
neuropsicológica implementados em contexto forense: reclusos, sujeitos
examinados em contexto médico-legal por solicitação de tribunais.
Finalmente, e sob pena de detectar apenas um número reduzido de falsos
negativos e/ou de classificar incorrectamente como "simuladores" um
número elevado de adultos idosos com declínio cognitivo, é necessário reafirmar
o sem sentido do recurso isolado ao 15-IMT (ou a qualquer outra medida de
simulaçãoou esforço insuficiente). O uso simultaneamente necessário e prudente
de uma medida como o 15-IMT apenas deve ser considerado com base nos resultados
obtidos no contexto de um processo desejavelmente sistemático de identificação,
ajustamento e validação de pontos de corte específicos, quer para grupos
normativos, quer para grupos mais homogéneos com Problemas Cognitivos (por
exemplo, DCL amnésico, DCL multi-domínios, Demência Ligeira, Deficiência Mental
Ligeira, etc.). Por outro lado, o uso da prova deverá ser também considerado no
âmbito de um protocolo de avaliação que inclua igualmente outros testes
orientados para a medida da simulaçãoou esforço insuficiente, quer testes de
validade de sintomas de escolha forçada (como o TOMM), quer instrumentos de
avaliação neuropsicológica com estudos na população portuguesa e que
proporcionem igualmente informação neste âmbito (WAIS-III, Matrizes
Progressivas de Raven, WMS-III, California Verbal Learning Test, Figura
Complexa de Rey, Trail Making Test).