CoPEP

A política da avaliação de políticas públicas

Em um plano normativo, a década de 1990 testemunhou, nas democracias ocidentais de uma maneira geral, e na América Latina particularmente, a busca de fortalecimento da "função avaliação" na gestão governamental. Com efeito, foram implementados, em diversos países da América Latina, sistemas de avaliação das políticas públicas de escopo variável. Tal processo tem sido justificado pela necessidade de "modernização" da gestão pública, em um contexto de busca de dinamização e legitimação da reforma do Estado.

Os argumentos que justificam a necessidade de institucionalização da avaliação da atividade governamental na América Latina também fazem eco à visão mais canônica do processo de avaliação de políticas públicas, aquela muitas vezes adotada em manuais e apreciações mais introdutórias, os quais apresentam a avaliação como "última etapa" do chamado "ciclo das políticas", definindo- a como: (a) atividade destinada a aquilatar os resultados de um curso de ação cujo ciclo de vida se encerra; (b) a fornecer elementos para o desenho de novas intervenções ou para o aprimoramento de políticas e programas em curso; e (c) como parte da prestação de contas e da responsabilização dos agentes estatais, ou seja, como elemento central da accountability. Mesmo que essa concepção reconheça, ainda que implicitamente, o caráter inextricavelmente político da avaliação, podemos observar nos debates e nos estudos correlatos mais recentes a prevalência de um viés francamente normativo e/ou uma priorização dos aspectos mais técnicos da avaliação das políticas públicas, bem como uma ênfase em seu papel de instrumento gerencial.

Reconhecendo o caráter incipiente da pesquisa e da prática da avaliação no Brasil, o presente trabalho tem como objetivos: (1) analisar os fatores que têm justificado e condicionado a implantação dos sistemas de avaliação, sobretudo nos países da América Latina; (2) averiguar as razões da prevalência, no âmbito estatal e também no plano analítico, de uma concepção "tecnicista" da avaliação, vista hoje quase exclusivamente como instrumento da gestão governamental; e, finalmente, (3) enfatizar o caráter eminentemente político da avaliação de políticas públicas, elencando e categorizando as suas distintas formas de utilização. Será ressaltada, assim, a virtual subordinação do uso gerencial da avaliação e de sua suposta capacidade de encerrar, reiniciar ou revitalizar o ciclo das políticas às injunções políticas mais abrangentes e às estratégias e interesses dos tomadores de decisão e dos demais envolvidos (aqueles que a literatura especializada denomina, desvelando suas matrizes intelectuais, stakeholders).

A institucionalização da "função avaliação" na América Latina: premissas, expectativas e motivações Diga-se, logo de início, o essencial: nas décadas de 1980 e 1990 a avaliação de políticas públicas foi posta a serviço da reforma do Estado.1 Se parece haver consenso quanto a essa questão, há, contudo, uma diversidade de maneiras de se pensar a evolução do papel atribuído à pesquisa avaliativa desde o início do boom da avaliação de políticas e programas públicos, ocorrido nos Estados Unidos na década de 1960. Guba e Lincoln (1989), por exemplo, tendo como foco os Estados Unidos e fazendo uma caracterização desde os anos de 1930, detectaram a emergência de quatro sucessivas "gerações" de pesquisas avaliativas, quais sejam: (1) um início com um viés mais técnico, no período do New Deal; (2) uma "geração" mais "descritiva", predominante desde a Segunda Guerra Mundial até meados da década de 1960; (3) uma que enfatizava a oferta de "julgamentos" abalizados, prevalecente entre meados dos anos de 1960 e meados da década seguinte, ou seja, quando da avaliação dos polêmicos programas da "Guerra à Pobreza" (War on Poverty) e da "Grande Sociedade" (Great Society); e, finalmente, (4) uma "geração" "reativa", característica dos anos Reagan.

Albaek (1998), por seu turno, afirma que, quando do início da massificação da avaliação nos Estados Unidos, na década de 1960, a pesquisa avaliativa era encarada predominantemente como ferramenta de planejamento destinada aos formuladores de políticas e aos gerentes de mais alto escalão. Em um contexto de expansão sem precedentes do gasto público no país, de escasso conhecimento acerca do impacto da ação governamental e da busca de um maior controle sobre os burocratas/implementadores, a avaliação é institucionalizada, tendo como característica predominante o seu desenho top-down. A expectativa era, ainda, a de que a avaliação, ao superar o problema de déficit de compreensão acerca desses processos e de seu impacto, pudesse garantir a racionalidade dos processos decisórios e a legitimação das políticas e dos programas. Essa "era de ouro" da avaliação, assim denominada por Rossi e Wright (1984), que, de acordo com Oakley (1998), teria durado até o final da década de 1980, foi dominada por um paradigma metodológico experimental ' "randomizado" e controlado ("randomised, controlled experimental paradigm", Oakley, 1998, p.

95) ' tendo sido dinamizada por uma Ordem Executiva do presidente norte- americano, que determinava que os programas sociais fossem avaliados.

Segundo Albaek (1998), na década de 1970 avolumaram-se as evidências acerca do excesso de otimismo no que dizia respeito à plena utilização e incorporação, de forma racional/instrumental, dos resultados das avaliações. O paradigma top- down foi assim progressivamente revertido, abrindo espaço para o desenvolvimento de abordagens e metodologias bottom-up. Nas décadas de 1980 e 1990, como se verá em detalhe adiante, a avaliação das políticas públicas foi posta a serviço da reforma do setor público.

Uma terceira forma de se pensar a maneira como têm variado as motivações do Estado para a valorização da avaliação de políticas é sugerida por Derlien (2001), em artigo particularmente interessante e provocativo. Partindo da distinção das três funções básicas atribuídas à avaliação ' informação, realocação e legitimação ', o autor defende a tese de que, dos anos de 1960 aos anos de 1990, os objetivos buscados com a avaliação teriam passado da função de informação para a de realocação. Tal deslocamento teria sido acarretado por fatores políticos e econômicos específicos, tendo havido também uma mudança nos atores políticos dominantes. Segundo Derlien, na década de 1990 passou a predominar em muitos países a função de realocação, associada ao movimento do New Public Management, tendo os avaliadores se convertido em auditores que privilegiavam a medição dos resultados. Vale a pena reproduzirmos aqui, em uma longa citação, a apresentação que o autor faz da função de (re)alocação, a qual, segundo sua tese, passa a pautar a ênfase na avaliação durante as duas últimas décadas: A função predominante da avaliação nos anos de 1980, durante a segunda etapa de institucionalizações, estava claramente destinada a apoiar uma alocação racional dos recursos. Nesse momento os atores principais já não são mais os administradores dos programas (como quando prevalecia a função de informação), mas os escritórios de auditoria, os ministérios da Fazenda e as unidades centrais, a quem compete a elaboração global do orçamento e sua estrutura interna. As questões básicas que passaram a ser enfatizadas são: ' Quais programas podem ser suprimidos ou reduzidos a partir dos resultados negativos da avaliação? ' Quais são as conseqüências do retrocesso das fronteiras do Estado, ou seja, da privatização de determinadas atividades públicas? ' Como se pode obter mais rendimento pelo dinheiro' a partir da reorganização dos programas individuais e das atividades públicas em seu conjunto? As questões induzidas dos motivos da alocação tendem a dar mais ênfase na quantidade do que na qualidade (Derlien, 2001, p.106).

É precisamente essa associação da "função avaliação" à reforma gerencialista do Estado, com ênfase nos resultados e na desresponsabilização/devolução/ privatização da provisão de bens e serviços sociais, que torna compreensíveis manifestações como estas de Vieira (1997): [...] [no] Brasil, desde o tempo da elaboração da Constituição de 1988, a febre avaliatória ganha dimensão de epidemia e os avaliadores metamorfoseiam-se em festejados demiurgos [...]" (p.70).

Esta nova fase de acumulação capitalista não se importa com direitos.

Seus filhos mais queridos, os recentes avaliadores, nutrem-se do relativismo tão a gosto da meritocracia (p.71).

Diga-se, de passagem, que reações como essa, que beiram a fobia, obscurecem a necessária percepção de que a avaliação "não é, por natureza, característica de um tipo específico de Estado ou cultura administrativa" (Thoenig, 2000, p. 57).

A seguir apresentaremos, de maneira sucinta, as premissas, as expectativas e as motivações para a institucionalização da "função avaliação" na América Latina.

Tal processo ocorreu tardiamente, apenas na década de 1990, tendo prevalecido a perspectiva de instrumentalização da pesquisa avaliativa para o sucesso da reforma do Estado. Tal discussão pavimentará o nosso caminho para que possamos, na seção subseqüente, analisar a postura da academia brasileira diante da hegemonia da perspectiva "gerencialista" sobre o papel da avaliação de políticas públicas.2 Como destacado por diversos autores, a medição e a avaliação do desempenho governamental e das políticas públicas tornaram-se parte integral da agenda de reformas dos anos de 1980 e 1990, as quais, como se sabe, estiveram longe de se circunscrever aos países latino-americanos. Tanto por razões pragmáticas como ideológicas ' e não nos parece pertinente arrolarmos aqui os fatores de ordem econômica, política e ideológica que têm dado sustentação aos processos de reforma do Estado em grande parte das democracias ocidentais ', o desenho dessas reformas privilegiou dois propósitos básicos. Em primeiro lugar, a adoção de uma perspectiva de contenção dos gastos públicos, de busca de melhoria da eficiência e da produtividade, de ampliação da flexibilidade gerencial e da capacidade de resposta dos governos, bem como de maximização da transparência da gestão pública e de responsabilização dos gestores, em um processo no qual o "consumidor" dos bens e serviços públicos estaria, supostamente, em primeiro plano. O segundo propósito ou expectativa é de que tais reformas pudessem contribuir para uma reavaliação da pertinência das organizações governamentais preservarem todo o seu leque tradicional de atribuições, prevalecendo um contexto de valorização da provisão privada de bens e serviços (Caiden e Caiden, 2001, p. 79).

Como corretamente assinalado por Caiden e Caiden, "a medição de desempenho, o monitoramento e a avaliação não foram apenas ornamentais nem tiveram uma significação incidental nas reformas. Foram (ou deveriam ter sido) as alavancas essenciais da mudança" (Idem, p. 80). Vale lembrar que Wiesner Duran chama a avaliação de "proxy do mercado na administração pública" (apudMokate, 2002, p.

90). A centralidade da avaliação justifica-se, assim, porque se esperava que essas "funções" garantissem a credibilidade do processo de reforma e a sustentabilidade política das diretrizes de desregulamentação e de redução do tamanho do governo, quer pela via da chamada "devolução", ou seja, do deslocamento das funções e dos serviços para as instâncias subnacionais, quer pela via da privatização. Esperava-se, também, que pudessem ser fomentadas a transparência na gestão pública e a satisfação dos usuários/clientes.

Parece por demais óbvio, pois, o caráter eminentemente político do projeto de "modernização" do Estado vinculado à "revolução" gerencialista que se deseja implantar, no qual o monitoramento e a avaliação de políticas ocupam lugar de destaque. Contudo, como se discutirá adiante, a política da avaliação das políticas públicas está longe de se restringir a questões e disputas relativas à definição dos interesses prioritários e do escopo do Estado, posto que a avaliação pode também, por exemplo, ser elemento central na disputa eleitoral, no controle das interações intergovernamentais e na busca de acomodação de forças e de interesses no âmbito intraburocrático.

A hegemonia inconteste da perspectiva "gerencialista": uma discussão exploratória acerca do papel da academia brasileira Pode parecer contraditório o fato de a nova ênfase dada à avaliação de políticas no Brasil aparentemente não ter despertado um interesse equivalente por parte da comunidade acadêmica dos analistas de políticas públicas, notadamente nas áreas da ciência política e da sociologia, no sentido de se abrir novas frentes de investigação. O mesmo parece não se dar, contudo, na seara da administração pública, como demonstrado, por exemplo, pela freqüência com que periódicos nacionais, como a Revista do Serviço Público e a Revista de Administração Pública, têm encampado a temática.3 Note-se, ainda, que a questão tem ganhado destaque também em publicações do Ipea,4 da Fundação Seade (Carvalho, 2003) e da Fundação Carlos Chagas, como os Cadernos de Pesquisa e os Estudos em Avaliação Educacional. É importante destacarmos aqui o viés acentuadamente normativo da maior parte destes trabalhos, bem como o fato de a Revista do Serviço Público republicar trabalhos de consultores internacionais muitas vezes produzidos a partir de demandas dos organismos multilaterais, o que evidencia o forte caráter de indução externa a vincar o processo de institucionalização dos sistemas de avaliação na América Latina.

Se for possível justificar esse panorama a partir do fato de a avaliação de políticas públicas ser tarefa eminentemente multidisciplinar, como é amplamente reconhecido, resta-nos buscar compreender o que pode ser denominado como a omissão da ciência política brasileira.5 Um primeiro elemento para se pensar tal omissão é a postura assumida por Michael Scriven, um dos primeiros e principais teóricos da avaliação, para quem a "investigação avaliativa deve produzir como conclusão exatamente o tipo de afirmação que os cientistas sociais dizem ser ilegítima: um juízo de valor ou mérito" (Scriven, 1974, apudBallart, 1996, p. 325). Esse viés normativo talvez possa nos ajudar na compreensão do seguinte paradoxo: se as investigações conduzidas na subárea da análise de políticas públicas são fortemente condicionadas pela conjuntura, como apontado por Melo (1999), tal condicionamento parece não ter sido suficiente para que a questão da avaliação ganhasse lugar de destaque na agenda de pesquisa dos profissionais da área, aqui entendida como subárea da ciência política.

Cabe recordarmos, ainda, que apesar do boom das duas últimas décadas, a estruturação do campo da análise de políticas públicas ainda é bastante incipiente no Brasil, o qual padece, como também mostrado por Melo (1999), de grande fragmentação organizacional e temática, tendo uma institucionalização ainda precária. Porém, se essas características podem tornar compreensíveis determinadas lacunas, a notória ausência de investimentos mais sistemáticos no estudo dos processos de implementação e avaliação parece evidenciar também o status privilegiado de que desfrutam os processos decisórios na ciência política do país. No entanto, [...] a escassez dos estudos "pós-decisão" no país parece explicada não apenas pela frágil institucionalização da área no Brasil, que faz com que a análise de políticas públicas continue gravitando na órbita das questões analíticas mais tradicionalmente valorizadas pela Ciência Política, mas também pela debilidade no país do campo de estudos da Administração Pública (Faria, 2003, p. 22).

Se a administração pública, como área de trabalho acadêmico, é extremamente débil no país, tendo, porém, ganhado certo vigor na década passada com a abertura de Escolas de Governo em diversos estados da Federação, sua interação com a ciência política e com a sociologia talvez ainda seja por demais frágil.

Retratado e explicado, assim, este panorama de omissão, cabe recordarmos, como discutido na seção anterior, que a atual "gerencialização" da avaliação de políticas públicas é, antes de tudo, derivada de sua instrumentalização no processo/projeto de reforma do Estado. Contudo, a concepção hoje prevalecente da avaliação como instrumento administrativo e, portanto, como função supostamente alheia às disputas propriamente políticas talvez fique ainda mais evidenciada em função da postura da ciência política brasileira, que acaba, assim, por endossar esse viés distorcido do princípio republicano da desvinculação entre política e administração pública.

Reconhecida, portanto, a hegemonia quase inconteste da perspectiva gerencialista ' e recorde-se que essa é a tônica dada à implantação dos sistemas de avaliação pelos organismos multilaterais, que têm investido sistematicamente nesse processo ao disponibilizar assistência técnica e financiamento, ao articular redes de profissionais, ao sensibilizar lideranças políticas e acadêmicas e ao atrelar o financiamento de projetos à exigência de avaliação ', parece-nos oportuno inventariarmos as distintas formas de uso esperado e potencial da avaliação de políticas públicas, para que possamos ampliar a nossa percepção do viés político da pesquisa avaliativa. Antes, contudo, cabe alertarmos para o fato de que, evidentemente, não se espera aqui que a ciência política seja capaz, por si só, de "(re)politizar" a avaliação de políticas públicas. Cabe a ela, isto sim, a análise do impacto e das implicações de tal hegemonia.

Os usos e a política da avaliação de políticas públicas Parte significativa dos estudos sobre os processos de avaliação de políticas públicas realizados desde a década de 1960, os quais, via de regra, tiveram (e ainda têm) o seu epicentro na academia norte-americana, refere-se às questões de ordem metodológica e/ou às distintas maneiras de se classificar a avaliação.

A avaliação tem sido, usualmente, classificada em função do seu timing"(antes, durante ou depois da implementação da política ou programa), da posição do avaliador em relação ao objeto avaliado (interna, externa ou semi-independente) e da natureza do objeto avaliado (contexto, insumos, processos e resultados)" (Cotta, 2001, p. 91). Como discutido na primeira seção deste ensaio, os estudos avaliativos tinham originalmente um acentuado viés top-down, sendo via de regra encarados como ferramenta de planejamento destinada aos formuladores de políticas e aos gerentes de mais alto escalão. Nesses primórdios, partia-se da premissa que os resultados da avaliação seriam automática e necessariamente encampados pelos tomadores de decisões para a melhoria da política ou do programa em questão. A discussão acerca do uso da avaliação restringia-se, assim, ao que hoje se denomina uso "instrumental".

Logo se percebeu, uma vez que se avolumavam as evidências de que o esperado efeito de feedback da avaliação era freqüentemente obstruído, a flagrante ingenuidade das expectativas de se produzir "melhores e mais sábias decisões" com base apenas na realizaçãoda avaliação. É a partir desse momento que se passa a investigar os determinantes do usoda avaliação, sendo constituída, assim, uma nova e vicejante seara de pesquisa.6 A ênfase nos fatores que condicionam a utilização da avaliação e a mitigação do "furor positivista" da época do primeiro boom dos estudos avaliativos (já que se pode dizer que vivemos hoje o seu segundo boom) abriu espaço para um maior questionamento, ainda hoje incipiente, diga-se, acerca do que chamo "política da avaliação de políticas públicas".

Vale lembrar que tal denominação é pensada neste ensaio como abarcando as questões e as disputas relativas à definição dos interesses prioritários e do escopo do Estado, à competição eleitoral, ao controle das interações intergovernamentais e à busca de acomodação de forças e de interesses no âmbito intraburocrático, entre muitas outras questões relacionadas às disputas de poder entre agentes e principais os mais diversos. Essa concepção mais abrangente engloba, assim, as três dimensões do uso da avaliação normalmente evocadas: instrumental (relativa ao apoio às decisões e à busca de resolução de problemas); conceitual (ou função "educativa"); e simbólica (uso "político") (Shulha e Cousins, 1997).

A percepção da vasta diversidade e da intensidade dos fatores que obstaculizam uma plena ou mesmo freqüente utilização da avaliação para o seu propósito "original" (melhorar a qualidade das decisões e garantir a maximização da consecução dos objetivos definidos pelas políticas e programas) produziu reações muito diferenciadas. Aaron Wildawsky, por exemplo, desalentado diante de tantos obstáculos, questiona, em um quase desabafo, o valor de toda a empreitada: "eu comecei pensando que era ruim não avaliar as organizações e terminei me perguntando por que elas têm que fazê-lo" (apud Caiden e Caiden, 2001, p. 94). Thoenig, por seu turno, parece propor, em algumas circunstâncias, o uso de "avaliações informais", as quais poderiam tornar possível a introdução de "ajustes e mudanças sem atrair a atenção de grupos interessados internos ou externos, que podem ser tentados a usar uma avaliação formal como uma oportunidade para resistir à reforma" (2000, p. 66). Muitas das análises mais recentes, contudo, ao reconhecer que as condições para o aproveitamento das informações disponibilizadas pela avaliação quase nunca estão dadas a priori, sugerem, a exemplo de Cotta, que a avaliação "é uma atividade que, por suas próprias características, exige que estas condições sejam intencional e meticulosamente criadas, sob pena de se comprometer todo o esforço despendido" (2001, p. 94).7 Mas quais seriam, mais especificamente, os fatores que podem interferir na utilização dos resultados da avaliação? Entre tantos outros possíveis, podem ser destacados os seguintes: existência de crenças e interesses conflitantes na organização que gerencia o programa; ocorrência de conflitos de interesses entre as distintas unidades do programa; mudanças no pessoal encarregado, quando, por exemplo, os novatos têm prioridades diferentes daquelas vigentes na época do início da avaliação; eventual inflexibilidade das regras e dos padrões operacionais da organização encarregada, que pode impedir a adoção das recomendações feitas quando da avaliação; e mudanças nas condições externas, tais como cortes orçamentários e alterações no ambiente político, que podem tornar impossível para a organização responder à necessidade de mudança revelada pelos avaliadores (Weiss, 1998, p. 22).

Como o objetivo deste ensaio, mais do que a análise de qualquer caso específico, é ressaltar a estreiteza da concepção gerencialista da avaliação e expandir a nossa percepção das múltiplas implicações políticas da pesquisa avaliativa, buscaremos a seguir elencar e categorizar as distintas formas de sua utilização. Seguindo de perto a proposta de Carol Weiss (1998), serão discutidas não apenas as formas de uso, mas também os elementos da avaliação que podem ser utilizados e, por fim, o papel e os interesses dos vários usuários potenciais da avaliação.8 É possível distinguir pelo menos quatro tipos de uso da avaliação, quais sejam: (a) instrumental; (b) conceitual; (c) como instrumento de persuasão; e (d) para o "esclarecimento". O uso instrumental para a tomada de decisão depende não apenas da qualidade da avaliação, mas também da adequada divulgação de seus resultados, de sua inteligibilidade e da factibilidade das recomendações eventualmente propostas. Segundo Weiss (1998), o uso instrumental seria comum em pelo menos quatro situações: (1) quando as implicações das descobertas da avaliação não são muito controvertidas; (2) quando as mudanças derivadas ou sugeridas não são de grande monta e/ou fazem parte do repertório do programa em questão ou de sua organização implementadora; (3) quando o ambiente do programa é relativamente estável no que diz respeito a suas lideranças, orçamento, tipos de beneficiários etc.; e (4) quando o programa está em crise e não se sabe bem o que deve ser feito.

O segundo tipo de uso é o "conceitual", usualmente circunscrito aos técnicos locais do programa, a quem não é com freqüência atribuído um maior poder de decisão. Nesse caso, as descobertas da avaliação (e o seu próprio processo de realização) podem alterar a maneira como esses técnicos compreendem a natureza, o modo de operação e o impacto do programa que implementam. Tal aprendizagem torna-se maximizada quando os técnicos participam mais ativamente do processo de avaliação.9 Como notado por Scriven (1996), o uso conceitual das descobertas diferencia-se do uso instrumental porque, no primeiro caso, nenhuma decisão ou ação é esperada (pelo menos não imediatamente).

O uso da avaliação como instrumento de persuasão, por seu turno, dá-se quando ela é utilizada para mobilizar o apoio para a posição que os tomadores de decisão já têm sobre as mudanças necessárias na política ou programa. Busca-se aqui legitimar uma posição e ganhar novos adeptos para as mudanças desejadas. O ponto pode ser ilustrado pela forma como o ditador Augusto Pinochet fez uso do sistema de avaliação educacional implantado por ele no Chile (Simce), em 1988, para dar maior visibilidade e legitimidade ao processo de privatização do ensino no país, posto que os primeiros resultados mostravam com clareza o desempenho superior das instituições privadas (Faria e Filgueiras, 2003).

Por fim, há o uso para o "esclarecimento", que nem sempre é propositado, mas que acarreta, pela via do acúmulo de conhecimento oriundo de diversas avaliações, impacto sobre as redes de profissionais, sobre os formadores de opinião e sobre as advocacy coalitions, bem como alterações nas crenças e na forma de ação das instituições, pautando, assim, a agenda governamental. Esse é um tipo de influência que ultrapassa a esfera mais restrita das políticas e dos programas avaliados.

Ainda que esta distinção das formas de uso da avaliação seja importante e inovadora, é necessário que se faça a seguinte ressalva: Note-se que tal distinção das formas de uso constitui avanço significativo em relação à célebre contraposição entre avaliação "somativa", que seria judgement-oriented, e avaliação "formativa", que seria improvement-oriented. Contudo, ela parece apenas resgatar, com modificações tópicas, a proposição feita por Floden e Weiner (1978) em um trabalho pioneiro, hoje aparentemente relegado, o qual, destacando também as debilidades e a idealização do "modelo decisionista", chama a atenção para o uso da avaliação nos seguintes sentidos: da "resolução de conflitos"; como mecanismo para a "redução de complacência" (complacency reduction), dado o seu potencial de fazer com que o pessoal encarregado do programa avalie criticamente as suas concepções e comportamentos; e como "ritual", cuja função seria "acalmar as ansiedades do público e perpetuar uma imagem do governo como racional, eficiente e accountable" (Faria e Filgueiras, 2003, p. 8).

No que diz respeito aos elementos da avaliação que podem ser utilizados, cabe destacar que as suas "descobertas" (ou o relatório final da avaliação) inicialmente monopolizaram a atenção daqueles interessados em investigar a questão da utilização da pesquisa avaliativa. Contudo, essas "descobertas" constituem apenas um dos elementos que podem ser utilizados. Como se sabe, elas usualmente se concentram nos processos, nos resultados e no impacto das políticas e dos programas.

Vale ressaltarmos, ainda que de maneira breve, que são exatamente as descobertas e/ou o relatório final da avaliação as informações mais amplamente divulgadas. A questão da abrangência e da forma de divulgação, que não é objeto de maiores considerações neste trabalho, é, contudo, absolutamente central para que se possa melhor aquilatar o uso dos estudos de avaliação. Discorrendo sobre a experiência de avaliação de políticas na França, Meldolesi afirma que, naquele país, [...] o problema não é a divulgação [dos relatórios], que é assegurada pela Documentation française, mas a pouca divulgação que eles têm nos jornais e, por conseqüência, na opinião pública: nada comparável ao canal de televisão especializado, que existe nos Estados Unidos, e à influência da avaliação do GAO (General Accounting Office) sobre o debate público naquele país" (1996, p.104).

Retornando à necessidade de se distinguir os elementos da avaliação que podem ser utilizados, reportamo-nos uma vez mais a Weiss (1998), que distingue a possibilidade de uso de outros quatro elementos: (a) idéias e generalizações derivadas da avaliação; (b) o próprio fato de a avaliação ter sido ou estar sendo feita; (c) o foco do estudo, especialmente as medidas adotadas; e, finalmente, (d) o desenho do estudo. A seguir discorreremos brevemente sobre cada um desses elementos.

(a) Uso das idéias e generalizações derivadas da avaliação Ainda que descobertas específicas da avaliação não sejam usadas, os formuladores e o pessoal técnico do programa podem aplicar idéias e generalizações dela derivadas. É o seguinte o exemplo dado por Weiss (1998): a generalização da descoberta de que agências locais não promovem mudanças no seu padrão de provisão de serviços quando elas são as únicas a fazer tais mudanças pode levar a que se pense na necessidade de se coordenar a atuação de todas as agências.

(b) Uso possível do próprio fato de a avaliação ter sido ou estar sendo feita São diversificadas as alternativas aqui. Primeiramente, a realização da avaliação pode ser utilizada como uma desculpa para a inação. Por que se deveria tomar qualquer atitude no sentido de se operar mudanças antes que se tenha o resultado do trabalho de avaliação? O fato de uma avaliação estar sendo ou ter sido feita pode ser utilizado também para demonstrar a racionalidade e a predisposição ao aprimoramento e à responsabilização por parte dos encarregados da política ou do programa. Por outro lado, a própria realização da avaliação pode ser pensada como assegurando uma aura de legitimidade para o programa ou sugerir que algo não vai bem em sua gestão ou que há problemas no seu desenho.

(c) Utilização do foco do estudo É amplamente reconhecido que o público (interno e o externo) do programa avaliado passará a dar atenção prioritária a todos os focos da avaliação, com destaque para os elementos escolhidos para serem mensurados. Esse fenômeno é conhecido como "ensinar para o teste", dado o efeito quase universal que a avaliação externa tem sobre o comportamento das instituições de ensino. Como se sabe, o risco principal aqui é que sejam negligenciados outros aspectos do programa que não incidem sobre os indicadores de sucesso definidos. Tal efeito, contudo, não é necessária e forçosamente negativo.

(d) Utilização do desenho da pesquisa avaliativa Destaca-se aqui a possibilidade de que as categorias de análise utilizadas pelos avaliadores, a metodologia de avaliação e a forma de se analisar os dados tenham influência não apenas sobre a gestão da política ou do programa em questão, ao fomentar, por exemplo, disputas entre distintos níveis de implementação, mas também sobre outras áreas e esferas de governo.

Por fim, é necessário inventariarmos também os usuários potenciais da pesquisa avaliativa. Originalmente, a comunidade de avaliadores era quase unânime na percepção de que os usuários da avaliação se restringiam aos financiadores do programa (e da própria avaliação), aos gerentes e encarregados de mais alto escalão e, por vezes, aos técnicos e profissionais que lidavam de maneira mais direta com os beneficiários. Esses são os atores que, inclusive, muitas vezes ajudam a definir o escopo, a abrangência, a metodologia e o âmbito de divulgação dos resultados da avaliação.

A crítica ao desenho hierárquico da avaliação e a percepção das limitações de seu planejamento top-down levaram, primeiramente, a que se prestasse mais atenção nos agentes encarregados da implementação ou na chamada street level bureaucracy, percebidos a partir da década de 1970 como capazes de muito mais autonomia do que aquela concebida pelos modelos tradicionais de planejamento (Pressman e Wildavsky, 1973; Lipsky, 1980).

Posteriormente, com a popularização das metodologias participativas de avaliação e com o crescente reconhecimento (e propaganda) da avaliação como instrumento de "empoderamento" dos beneficiários, a avaliação começou a levar em consideração, de maneira mais sistemática, as necessidades e as expectativas dos beneficiários dos programas. A reforma gerencialista do Estado, com sua ênfase nos resultados, em detrimento dos processos, e na satisfação daqueles que passaram a ser denominados "clientes", viria a sacramentar a ênfase nos beneficiários. Observada a questão de um ponto de vista mais abrangente, contudo, não deixam de parecer ingênuos comentários como: Os avaliadores freqüentemente optavam por levar em consideração os valores e os interesses dos clientes [sic], valorizando as suas preocupações. Mais do que reforçar o status quo, esses avaliadores esperavam produzir mudanças no sentido de tornar os programas mais "responsivos" às necessidades dos participantes. Eles queriam [...] "desafiar o discurso privilegiado dos poderosos". A sua postura significava um esforço em transformar a avaliação, de um mecanismo capaz de sustentar e reforçar as práticas correntes por meio de ajustes tópicos, em um meio de se remediar as desigualdades e de se redistribuir o poder (Weiss, 1998, p.27).

É certo que diversos outros usuários, para além daqueles envolvidos diretamente nos programas em questão, podem se valer das descobertas ou de outros elementos da avaliação. Dentre tantos, destacam-se: gerentes de programas similares e/ou de diferentes níveis governamentais; agentes do governo central e representantes de fundações, interessados em conhecer projetos exitosos que mereçam financiamento ou preocupados em melhorar os programas dos quais são responsáveis; membros do legislativo interessados na melhoria de programas existentes ou na elaboração de novas propostas; cientistas sociais e outros avaliadores que buscam aprender com as descobertas e com as metodologias empregadas. É ainda Weiss (1998) que sugere a existência de dois outros usuários potenciais: (a) as próprias organizações que administram o programa avaliado ou similares (e aqui deve ser feito não só o contraponto à tradicional ênfase no indivíduo como usuário, mas também deve ser mencionada a importância que tem sido dada atualmente à questão da learning organization ' "organização que aprende" ' e aos limites, tradições e procedimentos cristalizados e/ou impostos pelas organizações); e (b) o público em geral ou a sociedade civil.

A revisão crítica da literatura sobre a utilização da avaliação feita por Shulha e Cousins (1997) aponta as principais preocupações e questões que têm sido enfatizadas mais recentemente pelos estudiosos da área, quais sejam: a centralidade do contexto para a compreensão e a explicação do uso; a necessidade de se expandir a idéia de uso da esfera individual para a organizacional; a diversificação do papel do avaliador, que muitas vezes incorpora funções como a de facilitador, planejador e educador; e os impactos e condicionantes da não utilização ou da sub-utilização. Também passou a ser mais amplamente reconhecido o fato de que, para serem efetivamente utilizadas, as descobertas da avaliação devem competir com outras propostas e outras fontes de informação pela atenção dos tomadores de decisão e demais envolvidos, tudo isso se dando em contextos e instâncias decisórias que talvez possam ser mais bem caracterizados como pluralistas e frequentemente não racionais. Ademais, não deixa de ser importante recordarmos que o legado de Herbert Simon continua a ser evocado no que diz respeito, por exemplo, ao reconhecimento dos incentivos para que o sistema governamental adote um comportamento "satisfazedor", em detrimento de uma postura estritamente racional, no sentido da maximização do impacto de sua atuação.

Breves considerações finais Várias questões importantes podem ser inferidas a partir deste breve mapeamento das distintas formas de uso da avaliação, dos seus vários elementos que podem ser utilizados e dos usuários potenciais dos estudos de avaliação das políticas públicas. A primeira delas é que a literatura específica parece ainda essencialmente circunscrita às expectativas acerca do papel da avaliação elencadas pelo "modelo decisionista". Isso porque, mesmo tendo sido questionado o tradicional modelo hierárquico e top-down de planejamento e de desenho da avaliação, esta maior preocupação com a questão do uso da pesquisa avaliativa parece ainda fortemente restrita à utilização gerencial da avaliação e à necessidade de se gerar feedbacks que justifiquem a relevância da própria realização de tais estudos. Dito de outra forma, o que se pode verificar na literatura é uma ênfase quase exclusiva na utilização instrumental, intraburocrática, da avaliação das políticas públicas ou, quando muito, nas interações entre decisores, gestores e população beneficiária.

Ficam negligenciadas, assim, questões como: o papel da avaliação das políticas no jogo eleitoral; a reação do legislativo e do judiciário à concentração do poder de avaliação no executivo (Henry, 2001; Derlien, 2001); a eventual diferença na institucionalização da avaliação entre países parlamentaristas e presidencialistas e entre Estados federais e unitários (Derlien, 2001); o significado da distinta localização institucional dos sistemas de avaliação e o impacto de seu grau de vinculação às autoridades financeiras etc.

Dessa forma, não deixa de ser irônico, mas de maneira alguma contraditório, o fato de ser justamente a literatura que adota o enfoque gerencialista de valorização da avaliação como instrumento da reforma do Estado aquela que está aparentemente mais disposta a acentuar questões políticas mais abrangentes, como, por exemplo, o papel da avaliação na geração de accountability por parte dos agentes estatais, seu potencial de "empoderamento" das comunidades menos privilegiadas e seu impacto sobre a questão do controle social sobre o Estado.

O fato não é contraditório porque, como visto, essa literatura advoga um ideal regulativo que prescreve ao Estado um papel subsidiário, sendo determinantes os estímulos, os incentivos e os constrangimentos oriundos ou espelhados no mercado.

Uma postura de omissão no tratamento analítico das questões associadas ao processo de avaliação das políticas públicas e de seu uso, como aquela detectada no caso da ciência política brasileira (a qual, diga-se de passagem, parece não se singularizar neste aspecto), significa o esvaziamento da possibilidade de se analisar de forma cabal a política da avaliação de políticas, a qual acaba, assim, negligenciada em muitos de seus aspectos e implicações.

Se há resistências, por parte da ciência política brasileira, aí incluídos os analistas de políticas públicas, em encampar uma agenda de pesquisa que contemple os processos pós-decisão, como sugerimos, não seria possível e pertinente pensarmos a questão do uso e da política da avaliação como claramente vinculada aos processos decisórios? Caso seja necessária uma nota de cautela, lembramos que estudar o uso e a política da avaliação não implica, forçosa e automaticamente, a transposição da temida, e muitas vezes tênue, fronteira entre os papéis do analista e daquele que faz advocacy ou que prescreve cursos de ação.

Contudo, a despeito do ranço positivista que ainda pode ser observado na prática avaliativa e também nas análises sobre esse processo, a avaliação não deixa de envolver também, necessariamente, advocacy, como defende Greene (1997), na contracorrente do pensamento dominante na área.10 Isso, segundo a autora, se compreendermos por advocacynão um "partidarismo programático ou um viés contaminador", mas sim "uma adesão a valores como um ideal regulatório específico (relativo à racionalidade do processo decisório ou ao ativismo comunitário) (p. 25). Se levarmos também em consideração o fato de que a avaliação e os avaliadores atuam, como quer a vertente construtivista, "interpretando o contexto e construindo esse contexto e [que], portanto, ambos são produtores do espaço público" (Escolar e Domench, 2002, p. 110), torna-se ainda mais lastimável a negligência ou a omissão de nossos analistas de políticas públicas.

Notas 1 Para uma discussão sucinta a esse respeito, ver, por exemplo, Faria e Filgueiras (2003), Caiden e Caiden (2001) e Albaek (1998).

2 Para uma análise mais aprofundada a respeito da institucionalização dos sistemas de avaliação nos países latino-americanos, ver Bozzi (2001), que faz uma apreciação da experiência do Chile e da Colômbia; Silva (2002), que discute os casos de Argentina, Chile, Colômbia e Costa Rica; Silva e Costa (2002), que apresentam, ainda que muito sumariamente, as experiências de Brasil, Argentina e Chile; Ghirlanda (2002), que também trata do caso brasileiro. No que diz respeito à avaliação dos sistemas educacionais dos países latino-americanos, área em que se avançou muito na região, ver, por exemplo, Horn, Wolff e Vélez (1991); Ravela (2001); Wolff (1998) e Faria e Filgueiras (2003).

3 Ver, na Revista do Serviço Público, Meldolesi (1996); Thoenig (2000); Ala- Harja e Helgason (2000); Caiden e Caiden (2001); Derlien (2001); Bozzi (2001); Cotta (2001); Mokate (2002). Na Revista de Administração Pública, ver, por exemplo, Costa e Castanhar (2003).

4 Como, por exemplo, Calmon (1999); Garcia (2001); Escolar e Domench (2002); Silva (2002); e Silva e Costa (2002).

5 Comentando o presente ensaio durante os trabalhos do Seminário Temático "Processo decisório e implementação de políticas públicas no Brasil", durante o 28º Encontro Anual da Anpocs, em outubro de 2004, onde uma parte deste trabalho foi apresentada, Marta Arretche sugeriu a possibilidade de se pensar a administração pública como detendo no país a "hegemonia intelectual" na subárea dos estudos avaliativos, ao passo que economistas e econometristas teriam uma "hegemonia operacional". A pesquisadora sugeriu, ainda, que o que explicaria o subdesenvolvimento dos estudos sobre avaliação no Brasil não seria apenas a negligência, por parte da ciência política, dos processos pós-decisão (note-se que talvez esse quadro já tenha começado a ser reparado, como sugere o próprio enfoque do seminário mencionado). O problema não residiria apenas na agenda da ciência política, mas também, ou principalmente, seria decorrente da própria incipiência das avaliações no país, que não geraria polêmicas capazes de pautar a agenda investigativa.

6 Para bons panoramas dessa subárea de pesquisa, ver Shulha e Cousins (1997) e Weiss (1998). No Brasil esse é um campo ainda sobremaneira incipiente. Exceções são Cotta (2001), Faria e Filgueiras (2003) e, tendo como ênfase a questão da aprendizagem organizacional decorrente da utilização da avaliação, Calmon (1999).

7 Para além do desalento ou da simples incorporação de novas prescrições, acreditamos que pode ser dito sobre a pesquisa acerca do uso da avaliação o mesmo que Rivlin disse sobre a análise de políticas: ela pode não ter resolvido problema algum, mas pelo menos nos ajudou a determinar melhor os problemas (apud Weiss, 1998, p. 23).

8 Antes, porém, pode ser útil reproduzirmos aqui a sintética apresentação, feita por Ala-Harja e Helgason, das várias formas de uso, para que se possa ter uma visão panorâmica da questão e para que alguns termos centrais sejam introduzidos de maneira ainda mais simples: "A definição do uso de uma avaliação deve fazer distinção entre uso pelo programa e uso organizacional. O primeiro se refere a estudos individuais de avaliação, e o segundo tem a ver com o efeito cumulativo (aprendizagem) derivado de uma série de avaliações em uma organização. O uso em programas pode ser posteriormente dividido em uso instrumental, em que a avaliação dá suporte a ação específica (confirmação, modificação ou término), e o uso conceitual, em que não se toma nenhuma ação imediata, mas no qual os resultados são considerados e a informação é acumulada para uso posterior" (2000, p. 25).

9 Aliás, diga-se de passagem, a chamada avaliação "colaborativa", na qual avaliadores e corpo técnico do programa mantêm interação constante e amigável, compartilhando parte das decisões e dos procedimentos necessários, é muitas vezes tratada, na literatura específica, como a melhor maneira de se fomentar uma mais ampla utilização dos resultados da avaliação.

10 Vale a pena citarmos a seguinte passagem do trabalho de Greene: "a própria noção de avaliação como advocacy provoca tremores de desagrado e horror entre a maior parte da comunidade contemporânea da avaliação, tanto entre teóricos como entre praticantes. Isso porque o objetivo fundamental da avaliação era racionalizar a política social por meio da produção de informação científica desinteressada, relativa às opções de política, o que seria possível apenas por meio de uma adesão à objetividade e à neutralidade de valores. Advocacy é a antítese da avaliação justa, de acordo com aqueles ideais e visões fundadores.

Prescrever [to advocate] é esposar e promover uma crença ou postura partidária [partisan], abraçar e fazer avançar uma causa. Avaliar é, de acordo com a tradição, julgar de maneira justa a qualidade, o mérito e o valor de um programa, com base em informação imparcial, coletada de maneira científica" (1997, p.26).

Text view

BrBRHUHu0102-69092005000300007

View options