CoPEP

Avaliação da simulação ou esforço insuficiente com o Rey 15-Item Memory Test (15-IMT): Estudos de validação em grupos de adultos idosos

INTRODUÇÃO A credibilidade das queixas envolvendo funções cognitivas como a memória encontra-se entre os problemas mais comuns e difíceis de identificar na avaliação neuropsicológica em contexto forense. Neste âmbito, os resultados nos testes são habitualmente considerados como tendo um valor de evidência objectiva da validade dos sintomas cognitivos comunicados (défices ou declínio da memória, atenção, concentração, etc.) e dos seus efeitos funcionais nos comportamentos, desempenhos e actividades da vida diária. Contudo, os baixos resultados nos testes neuropsicológicos podem ser explicados por razões que não a presença de défices cognitivos, lesão ou disfunção cerebral. A motivação reduzida, o esforço incompleto/insuficiente ou mesmo a simulação (malingering), correspondem a "estilos de resposta" que podem explicar desempenhos problemáticos ou resultados inferiores nos testes neuropsicológicos.

O termo simulaçãoé definido pelo Manual de Diagnóstico e Estatística dos Distúrbios Mentais (DSM-IV) como a "produção intencional de sintomas físicos ou psicológicos, falsos ou exagerados, motivados por incentivos externos" (DSM-IV-TR; APA, 2002, p. 739), estando patentes nesta definição três elementos fundamentais: invenção ou exagero de sintomas, motivação ou intenção consciente do sujeito para simular e presença de incentivos externos. Por outro lado, são vários os autores que advertem para a necessidade de se conceptualizar os comportamentos de simulaçãonum continuum (cf. por exemplo, Bush, Ruff, Troster, Barth, Koffler, et al., 2005; Larrabee, 2005). Slick, Sherman, e Iverson (1999) apontam, neste âmbito, critérios de diagnóstico, em parte sobreponíveis ao apontado pela DSM-IV-TR, para Simulação de Perturbação Neurocognitiva Possível, Provável e Definitiva, que incluem: presença de incentivos externos substanciais, evidências nos resultados em testes neuropsicológicos, indícios de exagero de sintomas no auto-relato do sujeito, não devendo estes comportamentos de simulaçãoser melhor explicados por doença psiquiátrica, neurológica ou desenvolvimental (para uma redefinição do contributo dos testes psicométricos para o diagnóstico de Simulação de Perturbação Neuro-cognitiva Provável, cf. Larrabee, Greiffenstein, Greve, & Bianchini, 2007).

Existe uma evidência crescente da presença frequente de simulação(ou esforço insuficiente) nos desempenhos nos testes em pessoas que se encontram numa situação de litígio. Os ganhos secundários (incluindo incentivos de natureza financeira, redução de penas, alteração nas condições de trabalho, acesso a fármacos) podem desempenhar um papel relevante nestes casos (cf. por exemplo, Kitchen, 2003). Exemplos destas situações incluem o caso da avaliação da competência para testemunhar em contexto criminal, o exame das sequelas de traumatismo crânio-encefálico resultante de acidente de viação ou de trabalho, as consequências de práticas médicas incorrectas, os pedidos de reforma antecipada, em que as pessoas, incluindo adultos idosos, podem estar motivadas para simularou fingira presença de problemas mnésicos que constituem sintomas característicos de lesão, demência ou declínio cognitivo.

Atendendo à possibilidade de distorções na objectividade das respostas e desempenho individuais, que introduzem maior complexidade nos processos de avaliação neuropsicológica (Rogers, 1997), é facilmente compreensível a necessidade de examinar, de modo sistemático, a credibilidade das queixas de dificuldades cognitivas (ou dos sintomas de perturbação mental) e identificar os casos de desempenhos deficitários associados a incentivos externos, casos de incompatibilidade entre "doença e défices observados" e/ou de "inconsistência entre desempenhos ou comportamentos observados e a gravidade da lesão".

O exame da simulaçãoou do esforço insuficienteconstitui uma área de investigação e prática profissional em neuropsicologia, com desenvolvimentos importantes nas últimas duas décadas que se encontram recenseados em publicações específicas recentes (cf. por exemplo, Boone, 2007; Larrabee, 2007; Morgan & Sweet, 2009; Rogers, 2008). Apesar de constituir presentemente uma das áreas de maior crescimento no domínio da neuropsicologia forense, em Portugal é ainda muito rara a investigação com testes especificamente desenvolvidos para examinar a credibilidade das queixas e dos desempenhos cognitivos.

Este tipo de exame deve alicerçar-se no uso de vários testes. Neste contexto, a análise dos padrões de resposta (cf. Tombaugh, 2002) a instrumentos mais "clássicos" de avaliação neuropsicológica (por exemplo, WAIS-III, WMS-III, Trail Making Test) é uma das opções consideradas (para uma revisão, cf. Boone, 2007; Larrabee, 2007; Simões, 2005). Contudo, sabe-se que os testes neuropsicológicos tradicionais são menos objectivos na identificação destes "estilos de resposta" ou para confirmar se os sintomas são reais (e não exagerados ou fingidos), radicando também nesta limitação o desenvolvimento recente de testes específicos, de escolha forçada, os denominados Testes de Validade de Sintomas.

Reconhece-se actualmente que os testes de avaliação da validade de sintomas devem ser administrados não apenas em situações de litígio, nos casos em que a motivação pode ser problemática, quando surgem sintomas raros ou não credíveis formulados para obter simpatia ou atenção da família ou de outras pessoas significativas mas, igualmente, e de modo sistemático, em qualquer processo de avaliação (cf. por exemplo, Slick, Tan, Strauss, & Hultsch, 2004). A utilização de mais do que um teste especificamente construído para examinar a validade dos desempenhos constitui, presentemente, uma prática comum e representa um avanço importante na validação dos protocolos de exame neuropsicológico (Simões, 2006; Slick et al., 1999).

O Rey 15-Item Memory Test(15-IMT; Rey, 1964) é um dos instrumentos mais usados (Rabin, Barr, & Burton, 2005; Slick et al., 2004; Strauss, Sherman, & Spreen, 2006) para detectar a simulaçãode défices ou declínio mnésico (Reznek, 2005) ou o esforço insuficiente(Slick et al., 1999), com estudos em contexto forense/ /criminal envolvendo sujeitos considerados simuladores (ou suspeitos de simulação) institucionalizados em estabelecimentos prisionais (por exemplo, Frederick, Sarfaty, Johnston, & Powel, 1994; King, 1992; Simon, 1994). São várias as investigações empíricas que sugerem um desempenho mais pobre no 15- IMT por parte de indivíduos com incentivos externos para parecerem "incapacitados", por comparação com indivíduos que não têm esses incentivos (cf. por exemplo, Griffin, Normington, & Glassmire, 1996; Lee, Loring, & Martin, 1992).

O 15-IMT foi desenvolvido para avaliar a validade das queixas de memória visual imediata (Nitch & Glassmire, 2007) e da atenção (Heinze, 2003), com base no "princípio do efeito de tecto" (Rogers, Harrell, & Liff, 1993).

Apesar da tarefa de retenção dos 15 itens exceder, aparentemente, a capacidade de memória a curto prazo (7±2 itens; Miller, 1956), na realidade, o 15-IMT apenas requer a memorização de cinco unidades, uma vez que os referidos 15 itens podem ser agrupados em cinco categorias conceptuais. No entanto, o teste é apresentado explicitamente ao examinando como uma tarefa de memorização de 15 elementos diferentes, fazendo-a parecer mais difícil do que é na realidade (Nitch & Glassmire, 2007). Ou seja, trata-se de uma prova de tal modo simples que qualquer pessoa que não esteja significantemente deteriorada pode realizar facilmente (Lezak, Howieson, & Loring, 2004).

A identificação dos pontos de corte sugestivos de simulaçãoou esforço reduzidoconstitui uma tarefa essencial para a interpretação dos resultados no teste. Nesta base, para o 15-IMT têm sido propostos diferentes pontos de corte, considerando a pontuação no Ensaio de Evocação Imediata: 9 (por exemplo, Goldberg & Miller, 1986); 8 (Bernard & Fowler, 1990); 7 (por exemplo, Lee, Baker, & Gola, 1992); 6 (Arnett, Hammeke, & Schwartz, 1995).

Outros investigadores recomendam pontos de corte mais elevados: 10 (Greiffenstein et al., 1996) ou mesmo 14 (DiCarlo, Gfeller, & Drury, citados em Frederick, 2002).

São várias as vantagens atribuídas ao 15-IMT. Por um lado, o baixo custo, a administração fácil e rápida, a possibilidade de usar vários índices ou resultados quantitativos e as análises de natureza qualitativa (perseverações, omissões, erros reversíveis) (cf. por exemplo, Lee, Boone, Lesser, Wohl, Wilkins, & Parks, 2000; Marshall & Happe, 2007). Por outro lado, os dados da investigação apontam para valores de especificidade 1 elevados (superiores a 95%) em variadas amostras, tais como em pacientes com lesão cerebral severa (Taylor, Kreutzer, & West, 2003) ou de diferentes etiologias (Arnett, Hammeke, & Schwartz, 1995), pessoas idosas com Depressão grave (Lee et al., 2000), doentes com Traumatismo Crânio-Encefálico moderado e severo (Millis & Kler, 1995), pacientes com Epilepsia do Lobo Temporal e outras perturbações neurológicas (Lee, Loring, & Martin, 1992).

Evidenciados noutras pesquisas, os limites apontados a este teste residem principalmente na falta de sensibilidade (cf. por exemplo, Guilmette, Hart, Giuliano, & Leininger, 1994; Rogers et al., 1993; Vickery, Berry, Inman, Harris, & Orey, 2001). Num número mais reduzido de pesquisas são também identificados problemas quanto à especificidade dos resultados (Griffin et al., 1996; Guilmette et al., 1994; Schretlen, Brandt, Krafft, & Van Garp, 1991).

O 15-IMT foi recentemente objecto de um importante aperfeiçoamento com a introdução adicional de um Ensaio de Reconhecimento (Boone, Salazar, Lu, Warner-Chacon, & Razani, 2002) ao formato inicial de administração (Ensaio de Evocação Imediata, também denominado Ensaio de Evocação Livre).

As tarefas de Reconhecimento providenciam pistas que ajudam o examinando a recordar a informação apresentada previamente e são mais fáceis do que as tarefas de Evocação Livre. De modo particular, o reconhecimento visual tem sido apontado como uma capacidade preservada em pacientes com amnésia e com traumatismo crânio encefálico (Tombaugh, 1997). No entanto, as pessoas podem ter uma concepção errada de que as tarefas de Reconhecimento e de Evocação Livre são de igual nível de dificuldade (Nitch & Glassmire, 2007). Este facto explica a razão pela qual os simuladores apresentam desempenhos mais reduzidos nas tarefas de Reconhecimento do que pacientes reais (por exemplo, Greiffenstein, Baker, & Gola, 1996). Neste sentido, os paradigmas de Memória de Reconhecimento têm mostrado grande utilidade no exame de sintomas cognitivos não credíveis (Greiffenstein et al., 1996).

A introdução do Ensaio de Reconhecimento como tarefa integrante do 15-IMT veio possibilitar a identificação, com um grau de certeza "provável", do esforço suspeito (definido com base na classificação correcta de 75% de sujeitos) e, nesta medida, supera uma das limitações identificadas por Vallabhajosula e Van Gorp (2001) relativa ao não preenchimento do critério de evidência de admissibilidade científica em tribunal (normas de Daubert). De recordar que o recurso restrito ao Ensaio de Evocação Imediata (que constitui o formato original do teste) apresenta uma utilidade reduzida na classificação dos sujeitos em contexto forense (cf. Etcoff & Kampfer, 1996).

O exame da simulaçãoou do esforço insuficientefaz habitualmente parte integrante do processo de avaliação neuropsicológica forense e requer o uso de testes, com estudos de validação efectuados em diferentes grupos clínicos. No entanto, os grupos de adultos idosos com Declínio Cognitivo Ligeiro ou Demência são habitualmente excluídos das amostras de validação dos testes de esforço reduzido, incluindo os estudos que recorrem a amostras clínicas mistas. Como referem Boone e colaboradores (2002), a exclusão de pacientes com demência (ou deficiência mental) dos grupos clínicos estudados permite melhorar os valores de especificidade do teste. Contudo, é necessário admitir que os grupos clínicos de adultos idosos examinados em contexto forense manifestam frequentemente défices cognitivos e podem não apresentar os mesmos desempenhos dos adultos ou mesmo de adultos idosos sem problemas clínicos, pelo que é imperativo examinar e, eventualmente, ajustar os respectivos pontos de corte.

De facto, Van Gorp e Hassenstab (2009) reconhecem que, apesar do 15-IMT ser considerado pela maioria das pessoas como um teste fácil, estes métodos baseados no efeito de tecto podem não resultar do mesmo modo, por exemplo, com pessoas com doença mental severa ou demência. Daí a necessidade de examinar os perfis de desempenho em adultos idosos com e sem perturbação neurológica e/ou psiquiátrica, bem como proceder à análise da adequabilidade dos pontos de corte habitualmente referenciados na investigação publicada.

Com o presente estudo inicia-se este processo de validação do 15-IMT para a população portuguesa. Por um lado, examina-se a utilidade dos resultados no teste em grupos clínicos de adultos idosos que são crescentemente objecto de investigação em contexto forense (cf. por exemplo, Delgado-Losada, Rodríguez- Aizcorbe, & Fernández-Guinea, 2001; Simões & Sousa, 2008; Sousa, Simões, & Firmino, 2009). Especificamente, perturbações psicopatológicas (como a Depressão) ou neurocognitivas (como o Declínio Cognitivo Ligeiro e a Demência) são exemplos de problemas clínicos comuns que podem tornar-se objecto de litígio formal ou envolver algum contexto de ganho secundário, associado, por exemplo, à determinação de incapacidade e a pedidos de antecipação da reforma.

Assim, com este trabalho pretende-se examinar a validade e utilidade clínicas do 15-IMT em grupos de adultos predominantemente idosos da comunidade e seguidos em consulta externa devido a problemas cognitivos e/ou emocionais.

Para melhor compreender o perfil de desempenho destes grupos no teste foi também considerado um grupo de jovens adultos, sem qualquer tipo de condição clínica, a funcionar como grupo de controlo. Especificamente, considerar-se-ão, em termos de análise, os seguintes tópicos: I) Análise dos desempenhos no teste por parte dos grupos de adultos predominantemente idosos da comunidade (Saudáveis), com Problemas Cognitivos [Declínio Cognitivo Ligeiro (DCL) e Demência Ligeira] ou com diagnóstico de Depressão, em comparação com os resultados obtidos pelo grupo de Controlo (jovens adultos); II) Influência das variáveis demográficas idade, anos de escolaridade e género nos resultados no teste (para cada um dos grupos em estudo); III) Análise das inter-correlações entre os vários indicadores do teste (para os vários grupos); IV) Relação com medidas do funcionamento cognitivo e emocional, incluindo-se aqui a análise das correlações entre o desempenho no 15-IMT e os resultados nos seguintes instrumentos: Exame Breve do Estado Mental (MMSE), Escala de Depressão Geriátrica (GDS-30), Vocabulário (WAIS-III) e Localização Espacial (WMS-III) (para os três grupos de adultos predominantemente idosos); V) Análise crítica dos pontos de corte referenciados na literatura, quer para o Ensaio de Evocação Imediata, quer para o Ensaio de Reconhecimento (Resultado Combinado).

MÉTODO Amostra As amostras do presente trabalho encontram-se caracterizadas na Tabela 1, sendo constituídas por um grupo de 104 jovens adultos, com idades compreendidas entre os 22 e os 35 anos (grupo Controlo); por um grupo de adultos predominantemente idosos, de 116 sujeitos, com idades compreendidas entre os 55 e os 86 anos.

Mais especificamente, neste grupo de sujeitos, 46 têm diagnóstico psiquiátrico de Depressão, 37 apresentam diagnóstico de Declínio Cognitivo Ligeiro ou Demência Ligeira (grupo denominado por "Problemas Cognitivos"). O grupo da comunidade (Saudável) é composto por 33 sujeitos sem qualquer patologia psiquiátrica e/ou neurológica. Para estes grupos são igualmente apontados na Tabela 1 os resultados no MMSE, na GDS-30, nos testes Vocabulário e Localização Espacial. Não existem dados disponíveis para todos os sujeitos do grupo da comunidade relativamente a estas duas últimas provas.

TABELA 1 Médias, desvios-padrão, amplitudes e/ou frequências para as variáveis demográficasconsiderando os vários grupos examinados: Adultos predominantemente idosos e jovens adultos

Instrumentos Rey 15-Item Memory Test(15-IMT; Rey, 1964): instrumento construído para avaliar a validade de queixas relativas a problemas de memória. Consiste num cartão com 15 itens (5 linhas com 3 caracteres cada), apresentado ao examinando durante 10 segundos, após os quais o cartão é removido e, de imediato, pedido para reproduzir o máximo dos 15 itens que conseguir recordar (Ensaio de Evocação Livre Imediata). Boone e colaboradores (2002) desenvolveram um Ensaio de Reconhecimento que consiste na apresentação, após a administração do Ensaio de Evocação Imediata, dos 15 itens do cartão estímulo original e 15 distractivos, semelhantes aos itens do cartão inicial. Para além da consideração do número total de itens que foram correctamente reproduzidos (independentemente da sua localização espacial) no Ensaio de Evocação Imediata, os indicadores relativos ao Ensaio de Reconhecimento contemplam: (1) o número de itens correctamente identificados/ /reconhecidos; (2) o número de falsos positivos (itens incorrectamente assinalados); e (3) a pontuação combinada [Resultado Combinado do Reconhecimento = número itens correctamente evocados + (número de itens correctamente reconhecidos - número de falsos positivos)].

Exame Breve do Estado Mental (Mini Mental State Examination, MMSE; Folstein, Folstein, & McHugh, 1975; Guerreiro et al., citados em GEECD, 2008): instrumento de rastreio para uma avaliação breve da Demência. É constituído por uma série de questões e tarefas que permitem a avaliação das seguintes funções cognitivas: orientação (10 pontos), repetição (3 pontos), atenção e cálculo (5 pontos), memória (3 pontos) e linguagem (9 pontos). De acordo com os pontos de corte estabelecidos para a população portuguesa, consideram-se com "défice cognitivo" os analfabetos com pontuação igual ou inferior a 15, os indivíduos com 1 a 11 anos de escolaridade com pontuação igual ou inferior a 22, e os indivíduos com escolaridade superior a 11 anos com pontuação igual ou inferior a 27 (Guerreiro, 1998).

Escala de Depressão Geriátrica - 30 itens (Geriatric Depression Scale,GDS-30; Andrade, 2007; Barreto, Leuschner, Santos, & Sobral, citados em GEECD, 2008; Yesavage, Brink, Rose, Lum, Huang, Adey, & Leirer, 1983): instrumento breve de auto-resposta, especificamente construído para avaliar a sintomatologia depressiva na população geriátrica. A versão utilizada é constituída por 30 questões (resposta do tipo sim/não), cotadas com 1 ou 0 pontos, consoante esta indique, respectivamente, a presença ou ausência de um sintoma depressivo, podendo a pontuação total variar entre 0 e 30 pontos (os resultados mais elevados são indicativos de maior gravidade dos sintomas). Uma pontuação entre 0 e 10 traduz "ausência de depressão", entre 11 e 20 indica "depressão ligeira" e, no intervalo entre 21 e 30 sugere a presença de "depressão grave".

Vocabulário (WAIS-III; Wechsler, 2008a): tarefa que envolve a capacidade para expressar ideias por palavras. Avalia a capacidade intelectual verbal, sendo considerado um bom indicador de inteligência cristalizada e, desta forma, das aptidões pré-mórbidas. Nesta tarefa é pedido ao sujeito para definir oralmente um conjunto de palavras (por ordem de dificuldade crescente) que o examinador lê em voz alta, ao mesmo tempo que as apresenta impressas num cartão. As respostas são cotadas com 2, 1 ou 0 pontos, sendo que o resultado total oscila entre 0 e 66 pontos. Estes resultados brutos são, posteriormente, convertidos em resultados padronizados de acordo com a idade dos sujeitos.

Localização Espacial (WMS-III; Wechsler, 2008b): o teste é uma variação do Tabuleiro de Corsi, construído por analogia ao teste não verbal da memória de dígitos, sendo considerada uma medida de memória de trabalho visuo-espacial. A tarefa consiste na apresentação de sequências (por dificuldade crescente) de toques do dedo indicador, realizados pelo examinador num tabuleiro com 10 cubos. Após a apresentação de cada sequência, o sujeito deverá repeti-la na mesma ordem pela qual foi apresentada (sentido directo) ou em sentido contrário (sentido inverso), sendo atribuído 1 ponto por cada sequência correctamente reproduzida. Estes resultados brutos são, posteriormente, convertidos em resultados padronizados de acordo com a idade dos sujeitos.

Procedimento O grupo de jovens adultos é constituído por sujeitos de um curso de formação de Sargentos da GNR. Deste grupo estão excluídos casos com história de problemas neurológicos e/ou psiquiátricos, identificados com base nos dados de uma entrevista estruturada.

O grupo de adultos predominantemente idosos foi examinado no âmbito da Consulta de Gerontopsiquiatria dos Hospitais da Universidade de Coimbra, em Centros de Dia e na Comunidade. Os diagnósticos clínicos de DCL, Demência Ligeira e Depressão foram efectuados por um médico psiquiatra. Nestes grupos, o 15-IMT foi administrado no âmbito de um protocolo de avaliação neuropsicológica mais exaustivo, do qual fazem parte as provas referidas anteriormente e que são também objecto de análise no presente estudo. Desta forma, o MMSE e a GDS foram utilizados, respectivamente, como medidas de rastreio cognitivo e de sintomatologia depressiva, domínios essenciais na investigação envolvendo adultos idosos. O teste Vocabulário da WAIS-III foi administrado com o objectivo de obter um indicador de capacidade intelectual verbal. Finalmente, e considerando que o 15-IMT foi desenvolvido como uma prova de memória visual, o teste Localização Espacial da WMS-III foi incluído no protocolo de avaliação com a finalidade de ter uma outra medida de memória visual.

O Ensaio de Evocação Imediata do 15-IMT foi administrado antes da tarefa de Reconhecimento. Para o Ensaio de Reconhecimento foram calculados o número de itens correctamente identificados como pertencendo ao estímulo inicial, o número de itens incorrectamente apontados (falsos positivos, na terminologia de Boone et al., 2002; falsos alarmes, na conceptualização da Teoria de Detecção de Sinal) e o Resultado Combinado do Reconhecimento.

As análises estatísticas foram efectuadas com o auxílio do programa Statistical Package for the Social Sciences(SPSS - versão 15.0). Na comparação dos desempenhos entre os vários grupos em estudo foram utilizadas a One-way ANOVA com post hocde Sheffe (comparação dos 4 grupos em estudo) e o U de Mann-Whitney (comparação dos subgrupos com problemas de natureza cognitiva: DCL e Demência Ligeira). Para a análise do grau de associação entre diversas variáveis e/ou indicadores de desempenho foram empregues os coeficientes de correlação de Pearson.

RESULTADOS Análise dos desempenhos no teste por parte dos grupos de adultos predominantemente idosos e grupo de jovens adultos Os resultados obtidos no 15-IMT pelos três grupos de adultos predominantemente idosos (Saudáveis, Depressão e Problemas Cognitivos), equiparados quanto às variáveis idade e escolaridade, e pelo grupo de jovens adultos (Controlo) foram comparados, no sentido de averiguar se os grupos apresentam desempenhos distintos. Os resultados são apresentados na Tabela 2.

TABELA 2 Médias, desvios-padrão e amplitudes dos resultados no 15-IMT para os grupos em estudo

Foram observadas diferenças com significado estatístico entre os grupos em todos os indicadores do 15-IMT analisados: nº de itens correctamente evocados [F(3,212)=76.766; p<.01]; nº de itens correctamente reconhecidos [F (3,212)=62.802; p<.01]; nº de falsos positivos [F(3,212)=38.483; p<.01] e Resultado Combinado do Reconhecimento [F(3,212)=99.768; p<.01]. Pelas análises de post hoc, verifica-se que o grupo de jovens adultos (Controlo) apresenta desempenhos significativamente superiores relativamente aos restantes grupos (p<.01) em todos os indicadores do 15-IMT. Já o grupo de adultos predominantemente idosos com Problemas Cognitivos é o que apresenta pontuações significativamente inferiores aos demais grupos, com excepção do verificado no número de itens correctamente identificados no Ensaio de Reconhecimento, onde os resultados não diferem dos alcançados pelo grupo de idosos com diagnóstico de Depressão (p>.05). Salienta-se ainda a inexistência de diferenças com significado estatístico entre os grupos de adultos predominantemente idosos com Depressão e Saudáveis no número de Falsos Positivos e Resultado Combinado do Reconhecimento (p>.05).

No grupo com problemas de natureza cognitiva, foi comparado o desempenho no 15- IMT dos subgrupos de sujeitos com diagnósticos de DCL (n=18; 5 homens e 13 mulheres; Idade: 68.44±7.95) e Demência Ligeira (n=19; 9 homens e 10 mulheres; Idade: 70.89±9.57). Os sujeitos pertencentes a estes dois grupos têm, na sua maioria, o primeiro ciclo do ensino básico em termos de escolaridade e são equiparáveis quanto às variáveis demográficas.

Estes dois subgrupos diferiram de forma estatisticamente significativa na pontuação obtida no Ensaio de Evocação Imediata (U=98.500; p=.026) e no Resultado Combinado do Reconhecimento (U=96.500; p=.022), com o grupo de DCL a obter uma pontuação superior ao grupo de Demência Ligeira (Evocação Imediata: DCL=9.39±3.45; Demência=6.74±3.77; Resultado Combinado do Reconhecimento: DCL=17.06±6.94; Demência= 11.58±6.72). Apesar de se observar um desempenho ligeiramente superior por parte do grupo com DCL relativamente ao grupo com Demência Ligeira nos restantes indicadores (número de itens correctamente reconhecidos e número de falsos positivos), as diferenças não revelaram significado estatístico (p>.05).

Efeito das variáveis demográficas Considerando as diferenças de desempenho aludidas anteriormente, o impacto das variáveis idade, escolaridade e género foi examinado em cada um dos grupos em estudo para os principais indicadores passíveis de ser obtidos no 15-IMT.

A idade apenas demonstrou ter um impacto negativo no número de itens reproduzidos no Ensaio de Evocação Imediata (r=-.344; p<.01), especificamente no grupo com Problemas Cognitivos. Pela comparação das pontuações no 15-IMT obtidas pelos sujeitos em cada grupo de escolaridade considerado, não se reportaram diferenças com significado estatístico em nenhum dos grupos amostrais analisados (p>.05). Finalmente, no que diz respeito à variável género, apenas se observaram diferenças significativas no grupo com Problemas Cognitivos, tendo sido observado um desempenho superior das mulheres por comparação com os homens, no Ensaio de Evocação Imediata (U=86.000; p=.018) e no Resultado Combinado do Reconhecimento (U=87.500; p=.020).

Inter-correlações Foram calculadas as inter-correlações entre os vários indicadores passíveis de ser obtidos com o 15-IMT, para cada um dos grupos em análise.

Pela análise da Tabela 3, constata-se que em todos os grupos considerados é evidente a tendência para associações com significado estatístico entre o Resultado Combinado do Reconhecimento e a pontuação obtida no Ensaio de Evocação Imediata, sendo mais elevadas nos grupos de adultos predominantemente idosos (Problemas Cognitivos: r=.875, p<.01; Depressão: r=.916, p<.01; Saudáveis: r=.960, p<.01) por comparação ao grupo de jovens adultos (r=.739; p<.01). O Resultado Combinado do Reconhecimento revela-se ainda significativamente associado ao número de itens correctamente identificados no Ensaio de Reconhecimento (Problemas Cognitivos: r=.818, p<.01; Depressão: r=.907, p<.01; Saudáveis: r=.950, p<.01), mantendo-se a anterior tendência para valores mais baixos no grupo de jovens adultos (r=.636; p<.01), sendo que neste grupo (r=-.467; p<.01), no grupo de adultos predominantemente idosos Saudáveis (r=-.549; p<.01) e com Depressão (r=-.464; p<.01) foram também encontrados coeficientes de correlação significativos com o número de falsos positivos. Se atendermos à fórmula de cálculo do Resultado Combinado do Reconhecimento [número de itens evocados + (número de itens reconhecidos - falsos positivos); Boone et al., 2002], estes coeficientes de correlação positivos com o número de itens evocados e o número de itens reconhecidos, e negativos com o número de falsos positivos, são facilmente apreendidos.

Nos três grupos de adultos predominantemente idosos, e contrariamente ao encontrado no grupo de jovens adultos, observam-se associações significativas entre o número de itens reproduzidos no Ensaio de Evocação Imediata e o número de itens correctamente identificados no Ensaio de Reconhecimento, com coeficientes de correlação de .564 no grupo com Problemas Cognitivos, .738 no grupo com Depressão e .873 no grupo Controlo (todos com p<.01).

TABELA 3 Inter-correlações entre os indicadores do 15-IMT, para cada um dos grupos em estudo

Relação com medidas do funcionamentocognitivo e emocional A Tabela 4 apresenta os coeficientes de correlação entre as pontuações nos indicadores do 15-IMT e o desempenho em outras provas, nomeadamente no MMSE, GDS, Vocabulário e Teste de Localização Espacial. Esta análise foi efectuada para os três grupos de adultos predominantemente idosos (Saudáveis, Depressão e Problemas Cognitivos).

De um modo geral, é nos grupos de sujeitos com diagnóstico de Depressão e sem condição neurológica ou psiquiátrica (Saudáveis) que se observam os coeficientes de correlação estatisticamente significativos.

No grupo com Depressão observam-se associações com significado estatístico entre todos os indicadores do 15-IMT e os resultados no MMSE (itens evocados: r=.522, p<.01; itens reconhecidos: r=.613, p<.01; falsos positivos: r=-.353, p<.01; Resultado Combinado do Reconhecimento: r=.606, p<.01), bem como com os resultados no Teste de Localização Espacial (itens evocados: r=.381, p<.01; itens reconhecidos: r=.420, p<.01; falsos positivos: r=-.371, p<.01; Resultado Combinado do Reconhecimento: r=.468, p<.01) e, ainda, entre a pontuação na Evocação Imediata e o resultado no Vocabulário (r=.371; p<.05). No grupo de adultos predominantemente idosos Saudáveis verificam-se também coeficientes de correlação significativos entre todos os indicadores e o MMSE (itens evocados: r=.527, p<.01; itens reconhecidos: r=.497, p<.01; falsos positivos: r=-.522, p<.01; Resultado Combinado do Reconhecimento: r=.563, p<.01), sendo observada uma associação estatisticamente significativa entre os falsos positivos e o desempenho no teste de Localização Espacial (r=-.665; p<.01).

TABELA 4 Coeficientes de correlação entre os resultados nos vários indicadores do 15- IMTe pontuações no MMSE, Vocabulário, GDS e localização espacial,para os três grupos de adultos predominantemente idosos

Análise crítica dos pontos de corte Para cada um dos grupos em estudo foi calculada a percentagem de sujeitos com pontuação inferior aos pontos de corte mais comummente apontados na literatura para o 15-IMT: <9 para o Ensaio de Evocação Imediata e <20 para o Resultado Combinado do Ensaio de Reconhecimento.

No grupo com Problemas Cognitivos, 51.4% dos sujeitos pontuaram abaixo do ponto de corte para o Ensaio de Evocação Imediata e 78.4% no Reconhecimento. No grupo com Depressão, estes valores percentuais desceram para 29.3% na Evocação Imediata e 43.5% no Reconhecimento, enquanto no grupo sem condição neurológica ou psiquiátrica (Saudáveis) 21.2% dos sujeitos reproduziram menos de 9 elementos na Evocação Imediata, sendo que 33.3% pontuaram também abaixo do ponto de corte no Reconhecimento. Por fim, importa salientar que no grupo de jovens adultos, nenhum indivíduo pontuou abaixo dos pontos de corte habitualmente considerados, quer no Ensaio de Evocação Imediata, quer no Ensaio de Reconhecimento.

É necessário um valor elevado de especificidade para minimizar a ocorrência de erros falsos positivos. Neste sentido, e para uma análise mais aprofundada, foi calculada a especificidade de vários pontos de corte apontados na literatura, para o Ensaio de Evocação Imediata e Resultado Combinado do Reconhecimento considerando os 4 grupos em estudo. Os resultados são apresentados na Tabela 5.

TABELA 5 Valores de especificidade relativa aos pontos de corte do ensaio de evocação imediata e do ensaio de reconhecimento, para todos os grupos

Com vista a uma melhor compreensão dos pontos de corte relativos ao Ensaio de Evocação Imediata e Resultado Combinado do Reconhecimento, foram calculados os percentis para cada para o um dos grupos. Estes dados são apresentados na Tabela 6.

TABELA 6 Percentis relativos ao ensaio de evocação imediata e ao ensaio de reconhecimento,para cada um dos grupos: Adultos predominantemente idosos (problemas cognitivos, depressão, saudáveis) e controlo (jovens adultos)

Na Evocação Imediata e com base, quer no resultado no Percentil 5 (Tabela 6), quer nos elementos referidos relativos à especificidade (Tabela 5), o ponto de corte ≤6 parece apresentar-se como aceitável para os grupos Depressão e Saudáveis. Quanto ao Resultado Combinado do Reconhecimento, considerando o Percentil 5, foram observados resultados substancialmente inferiores ao ponto de corte 20 nos grupos de adultos predominantemente idosos: respectivamente 2 (Problemas Cognitivos); 5.70 (Depressão) e 11.70 (Saudáveis) e uma pontuação bastante superior (27) no grupo de jovens adultos.

DISCUSSÃO Os dados obtidos apontam para diferenças de desempenho nos grupos estudados e são convergentes com o indicado em 1991 por Schretlen e colaboradores (relativamente ao Ensaio de Evocação Imediata), referindo que os pacientes com amnésia e défice cognitivo severo causado por variadas condições neuropsicológicas apresentam um desempenho bastante reduzido no 15-IMT. Embora superiores aos desempenhos do grupo com Problemas Cognitivos (8,03±3,81), as pontuações médias observadas no grupo com Depressão (10,40±3,33) foram, ainda assim, inferiores aos resultados da investigação de Lee e colegas (2000) com adultos idosos diagnosticados com Depressão severa (12,27±2,76).

A constatação de diferentes perfis de desempenho adverte-nos, por um lado, para o imperativo de adequar os pontos de corte aos vários grupos que são especificamente objecto de avaliação e, por outro, para a necessidade de estudar os desempenhos destes grupos de forma independente.

No que diz respeito ao efeito da idade no desempenho no 15-IMT, os resultados da investigação publicada são pouco convergentes. Existem alguns estudos a apontarem a inexistência de um efeito da idade (Boone et al., 2002; Nelson, Boone, Dueck, Wagener, Lu, & Grills, 2003), enquanto noutros se observa um efeito significativo desta variável (Schretlen et al., 1991), bem como da escolaridade (Boone et al., 2002; Nelson et al., 2003). Por outro lado, à semelhança do constatado por Nelson e colaboradores (2003), no presente trabalho também não foram encontradas diferenças entre os desempenhos de homens e mulheres.

Os valores de inter-correlações obtidos são, em parte, convergentes com os reportados por Boone e colaboradores (2002). Estes investigadores encontraram também associações significativas entre as pontuações da Evocação Imediata e o número de itens correctamente assinalados no Ensaio de Reconhecimento (r=.63) em grupos clínicos, com problemas de aprendizagem e controlo, mas não com os falsos positivos (à semelhança do observado no presente trabalho, em que a única excepção é verificada no grupo de adultos predominantemente idosos Saudáveis, com uma associação negativa de r=-.441; p<.05). Boone e colegas (2002) referem ainda uma associação significativa entre o número de itens correctamente reproduzidos e o número de falsos positivos (r=-.34), resultado replicado no presente trabalho, nos grupos de adultos predominantemente idosos com Depressão, Saudáveis e Controlo (jovens adultos).

Quanto à relação entre os desempenhos no 15-IMT e as pontuações em outras provas, os resultados vão ao encontro do reportado em várias pesquisas. Neste sentido, Schretlen e colaboradores (1991) observaram uma correlação significativa entre o número de itens evocados e os resultados do MMSE (r=.81; p<.001) numa amostra heterogénea de pacientes com perturbação mental, amnésia, demência e outras condições neuropsiquiátricas. Nelson e colaboradores (2003) obtiveram igualmente correlações estatisticamente significativas com medidas de avaliação da memória (Figura Complexa de Rey, Warrington Recognition Memory Test, Memória de Dígitos) numa amostra de 105 pacientes em situação de litígio ou com pedido de compensação que evidenciavam sintomas não credíveis em testes psicométricos e critérios comportamentais.

A ausência de associações significativas entre o desempenho no 15-IMT e as pontuações na GDS traduz a inexistência de um efeito da severidade da sintomatologia depressiva nos resultados na prova, sendo este dado convergente com o reportado por Lee e colaboradores (2000) num grupo de idosos com Depressão. Nesta investigação, os grupos de idosos com depressão ligeira, moderada e severa (identificados através da Hamilton Depression Rating Scale) não se diferenciaram no desempenho no 15-IMT, não existindo também correlações com significado estatístico entre a pontuação nesta escala de avaliação da sintomatologia depressiva e a pontuação no 15-IMT. Os autores concluíram que o aumento da severidade da sintomatologia depressiva não tem efeito no desempenho no 15-IMT, um dado adicional que suporta o uso desta prova.

A anterior constatação de perfis de desempenho diferenciados nos vários grupos em estudo obriga a uma análise crítica e individual dos pontos de corte.

Neste sentido, e em convergência com as percentagens de adultos predominantemente idosos a pontuar abaixo dos pontos de corte (quer no Ensaio de Evocação Imediata, quer no Resultado Combinado do Reconhecimento), especialmente no grupo com Problemas Cognitivos, estão os resultados do estudo de Schretlen e colegas (1991), que constataram que muitos sujeitos não simuladores (pacientes com deficiência mental, demência ou amnésia) pontuam abaixo do ponto de corte 9 sugerido para a Evocação Imediata. Ou seja, utilizando o ponto de corte de <9, o 15-IMT apresenta uma especificidade inaceitável em indivíduos com demência (Schretlen et al., 1991), embora seja possível apurar, num estudo recente, valores de especificidade mais aceitáveis (86%) quando os pontos de corte são ajustados para 6 ou menos itens (D'Arcy & McGlone, 2000).

Com base numa pontuação inferior a 9 na Evocação Imediata, Hurley e Deal (2006) concluem, no seu estudo, que 80% dos sujeitos com deficiência mental seriam incorrectamente classificados como estando a "simular", tal como

a. o sucedido com os casos de demência. Contudo, b. o desempenho do grupo de jovens adultos (nenhum sujeito pontua abaixo do ponto de corte no Ensaio de Evocação Imediata) acabou por ir ao encontro das conclusões de Schretlen e colaboradores (1991), segundo as quais pessoas sem défices cognitivos acentuados, sem doença neurológica demonstrada ou perturbação mental severa não devem reproduzir menos de 9 elementos no Ensaio de Evocação Imediata.

Tendo em consideração os comentários formulados relativamente às percentagens de sujeitos incorrectamente classificados como "simuladores", em casos provenientes de populações clínicas, e reportando aos valores de especificidade calculados, os dados obtidos convergem com os estudos que documentam uma baixa especificidade da prova em populações com Demência (Dean, Victor, Boone, Philpott, & Hess, 2009; Hays, Emmons, Stallings, 2000; Philpott, 1992; Schretlen et al., 1991) ou outro tipo de défices cognitivos, como é o caso da Deficiência Mental (Dean, Victor, Boone, & Arnold, 2008; Goldberg & Miller, 1986; Hurley & Deal, 2006; Marshall & Happe, 2007).

Com base na análise dos percentis ressalva-se que o ponto de corte ≤6 (Ensaio de Evocação Imediata) parece apresentar-se como aceitável para os grupos Depressão e Saudáveis, convergindo com propostas apontadas para grupos clínicos com lesões cerebrais de diferentes etiologias (Arnett et al., 1995), Demência e perturbações psiquiátricas graves (D'Arcy & McGlone, 2000; Schretlen et al., 1991), Epilepsia do lobo temporal (Lee et al., 1992), apesar de se revelar ainda inadequado para o grupo Problemas Cognitivos (DCL e Demência Ligeira).

Em sentido inverso, no grupo Controlo (jovens adultos), a pontuação de 12 (correspondente ao Percentil 5) mostrou que o ponto de corte habitualmente proposto (9) pode ser eventualmente pouco sensível, sugerindo a necessidade de verificar em futuros estudos com outras amostras a recomendação de outros investigadores que aconselham o recurso a pontos de corte mais elevados (cf.

por exemplo, Greiffenstein, et al., 1996). Os dados do presente estudo estão igualmente em consonância com a conclusão de Schretlen e colaboradores (1991) quando referem que, ao contrário do que acontece em adultos normais, e apesar da sua simplicidade, o teste (especificamente o Ensaio de Evocação Imediata) é menos afectado por um efeito de tecto quando aplicado em populações clínicas.

Ao desenvolver o Ensaio de Reconhecimento para o 15-IMT, Boone e colaboradores (2002) procuraram melhorar a sensibilidade do teste mantendo um elevado nível de especificidade. Com efeito, estes autores concluíram que o uso da Evocação Imediata combinada com as pontuações obtidas no Ensaio de Reconhecimento (utilizando o ponto de corte <20) aumenta a sensibilidade da prova de 47% para 71%. Desta forma, o uso do Resultado Combinado em complemento à pontuação única da Evocação Imediata parece constituir uma abordagem mais eficaz na detecção de casos de simulaçãoou de esforço insuficiente.

CONCLUSÕES Para determinar, de modo "definitivo", a natureza não credível do desempenho é recomendável o recurso a vários testes e indicadores ou índices de esforço (Bush et al., 2005). O presente estudo deve ser entendido neste âmbito mais lato de validação de um instrumento que pode vir a integrar, desejavelmente com outras medidas de exame da simulaçãoou esforço insuficiente, os protocolos de avaliação neuropsicológica em contexto forense. Neste plano, convém lembrar igualmente que o exame da validade de um teste corresponde a um processo contínuo e sistemático de investigação e supõe a realização de vários estudos com recurso a amostras diversificadas.

Embora sejam necessários mais estudos, os presentes resultados sugerem que os pontos de corte propostos na literatura, <9 (Ensaio de Evocação Imediata) e <20 (Resultado Combinado do Reconhecimento), parecem ser adequados para o exame dos comportamentos de simulaçãoou esforço insuficientepor parte de sujeitos adultos sem problemas clínicos, mas o seu uso não pode ser generalizado a adultos idosos independentemente da presença ou não de problemas clínicos (deterioração cognitiva ou depressão). Sob pena de identificar erroneamente muitos sujeitos destes grupos clínicos como "simuladores" ou como manifestando "esforço insuficiente", é forçoso ajustar os pontos de corte para um valor inferior a 9, próximo de 6 (correspondente ao Percentil 5 e a valores de especificidade superiores a 95%) considerando os resultados no grupo Saudável e com Depressão, à semelhança do proposto noutras pesquisas. Contudo, e especificamente para o grupo com Problemas Cognitivos (DCL e Demência Ligeira), este ajustamento deverá remeter provisoriamente para um valor ainda mais reduzido. À semelhança do sugerido num estudo recente com o Test of Memory Malingering(TOMM) (Mota, Simões, Amaral, Dias, Luís, Pedrosa, Maior, & Silva, 2008), o 15-IMT não é uma medida insensível a formas de declínio ou défice cognitivo ou mesmo ao nível de funcionamento cognitivo pré-mórbido (cf.

Hays, Emmons, & Lawson, 1993).

De modo complementar, e considerando o valor das correlações positivas entre medidas do funcionamento cognitivo (inteligência, memória) e os indicadores do 15-IMT, deve ser igualmente reconhecida a importância destas variáveis nos desempenhos em medidas de exame da simulaçãoou esforço insuficiente. Dito de outro modo, convém reconhecer que os resultados no 15-IMT são influenciados por variáveis que não (apenas) o esforço insuficienteou a intenção de simulardéfices de natureza cognitiva (memória, atenção). Neste contexto, deve ser reconhecida a possibilidade de níveis inaceitáveis de especificidade relativamente à probabilidade de simulaçãoou esforço insuficientenum número muito elevado de pacientes com problemas cognitivos e pertencentes a determinados grupos clínicos - Demência, Acidente Vascular Cerebral, défices mnésicos acentuados, Psicose em idade avançada, níveis de inteligência baixos (QIs inferiores, deficiência mental), baixo nível escolar (cf. Nitch & Glassmire, 2007) - quando se recorre a valores de pontos de corte previamente definidos a partir de grupos não clínicos. Ou seja, não é possível generalizar a casos pertencentes a estes grupos especiais, e que não são aliás raros, os dados da investigação empírica publicada que conclui que quando se observam pontuações inferiores a 9 (Ensaio de Evocação), este resultado é sugestivo da presença de esforço insuficienteou simulação. Esta impossibilidade de generalização dos resultados, independentemente dos grupos examinados, é igualmente válida para o ponto de corte do Resultado Combinado do Ensaio de Reconhecimento.

O recurso ao Ensaio de Reconhecimento poderá aumentar os valores de sensibilidade desta prova sem sacrificar os parâmetros de especificidade, mas são igualmente necessários mais estudos de validação para este método recentemente proposto.

O presente estudo apresenta alguns limites. Neste plano, é necessário referir que as amostras usadas não apresentavam qualquer evidência de suspeita de simulação, incentivos externos ou ganhos secundários. Futuros estudos deverão incluir um grupo de sujeitos suspeitos de simulaçãoou esforço insuficiente(com motivação para exagerar sintomas), uma vez que o recurso a este tipo de testes supõe investigação empírica que evidencie que apenas os simuladores "falham" em tais medidas. Uma outra limitação remete para a natureza e o tamanho reduzido das amostras clínicas de adultos predominantemente idosos, bem como para a natureza do grupo de jovens adultos (amostra de conveniência). Para futuros estudos de natureza normativa, a amostra de adultos e adultos idosos saudáveis deverá também ser alargada, de modo a autonomizar melhor o grupo de adultos idosos e sujeitos com idades compreendidas entre os 45 e os 64 anos de idade.

Alguma investigação necessária para colmatar estas limitações encontra-se presentemente em curso. Juntamente com outros testes de validade de sintomas como o TOMM, o 15-IMT é presentemente administrado em protocolos de avaliação neuropsicológica implementados em contexto forense: reclusos, sujeitos examinados em contexto médico-legal por solicitação de tribunais.

Finalmente, e sob pena de detectar apenas um número reduzido de falsos negativos e/ou de classificar incorrectamente como "simuladores" um número elevado de adultos idosos com declínio cognitivo, é necessário reafirmar o sem sentido do recurso isolado ao 15-IMT (ou a qualquer outra medida de simulaçãoou esforço insuficiente). O uso simultaneamente necessário e prudente de uma medida como o 15-IMT apenas deve ser considerado com base nos resultados obtidos no contexto de um processo desejavelmente sistemático de identificação, ajustamento e validação de pontos de corte específicos, quer para grupos normativos, quer para grupos mais homogéneos com Problemas Cognitivos (por exemplo, DCL amnésico, DCL multi-domínios, Demência Ligeira, Deficiência Mental Ligeira, etc.). Por outro lado, o uso da prova deverá ser também considerado no âmbito de um protocolo de avaliação que inclua igualmente outros testes orientados para a medida da simulaçãoou esforço insuficiente, quer testes de validade de sintomas de escolha forçada (como o TOMM), quer instrumentos de avaliação neuropsicológica com estudos na população portuguesa e que proporcionem igualmente informação neste âmbito (WAIS-III, Matrizes Progressivas de Raven, WMS-III, California Verbal Learning Test, Figura Complexa de Rey, Trail Making Test).

Representação em texto

EuPTHUHu0870-82312010000100015

Opções de representação