Polígonos de Voronoi como alternativa aos problemas das áreas mínimas
comparáveis: uma análise das mudanças populacionais na região norte do Brasil
Introdução
Como analisar a alteração de uma variável socioeconômica de um município que
foi desmembrado em três novos municípios? No Brasil, o estudo dessas variações,
como é o caso de mudanças populacionais, é tarefa razoavelmente complexa. Isso
ocorre devido às constantes emancipações de distritos a partir do
desmembramento de um ou mais municípios. Assim, comparar o dinamismo econômico
de um local em relação a outro, por exemplo, esbarra no problema supracitado. A
solução encontrada é o uso de Áreas Mínimas Comparáveis ' AMC, que consiste em
agrupar os dados dos novos municípios aos daqueles que os originaram. Embora
seja a maneira mais prática, este método pode gerar testes estatísticos
viesados, pois não considera as variações locacionais. Isso pode acarretar
sinais invertidos dos parâmetros ou a subestimação e/ ou superestimação dos
mesmos.
Até 2007, as análises do comportamento de variáveis censitárias eram
restringidas às microrregiões ou macrorregiões brasileiras. Isso ocorria devido
às mudanças territoriais resultantes dos desmembramentos dos municípios, que
dificultavam as análises econômicas nesse nível de desagregação. Reunindo
grande esforço para contornar essa deficiência, o Ipea/Nemesis1 recompôs todas
as unidades territoriais do Brasil, desde 1872 até 2005, que podem ser
comparadas entre dois pontos no tempo (REIS et al., 2008). Contudo, não há
séries de dados de AMC para o período de 1980 a 2000.
Apesar da grande contribuição do Ipea/ Nemesis, as agregações utilizadas não
contemplam algumas situações, entre as quais se destacam três:
* não são consideradas as proximidades geográficas de distritos a centros
urbanos alocados em outras AMC. Consequentemente, um município pode fazer
parte de uma AMC sem sofrer nenhuma influência dos municípios que lhe
deram origem, mas sim dos municípios da AMC vizinha;
* a agregação de valores é feita pela simples soma dos dados, sem
ponderações. Essa deficiência pode gerar viés nos testes estatísticos,
visto que o método não permite variações locacionais;2
* a amostra fica reduzida, inferior ao número de municípios do período-
base.
Na literatura brasileira, existem algumas propostas no intuito de contornar os
problemas das AMC. Paiva (2007 e 2008) aborda uma metodologia elaborada na
Fundação de Economia e Estatística e Universidade de Santa Cruz do Sul. Segundo
o autor, os valores absolutos, associados aos municípios criados num intervalo
de tempo, são imputados aos municípios que lhes deram origem, na proporção da
contribuição dos mesmos. Este método corrige a falha de proporção de agregação
dos dados, porém, não elimina os efeitos que os municípios geradores causam nos
novos municípios, isto é, o problema da proximidade geográfica.
Para identificar e quantificar áreas urbanas, Feitosa et al. (2005) propõem
metodologia para a compatibilização da geometria dos setores censitários e dos
seus respectivos dados. De acordo com os autores, essa metodologia permite a
agregação e desagregação de alguns setores devido à integração de dados
populacionais a dados do meio físico. Contudo, o processo parece tornar-se mais
difícil à medida que se expande a área de análise, pois é preciso combinar
imagens de satélites em dois períodos distintos. Portanto, este método tem mais
aplicabilidade numa área pequena, como uma cidade, por exemplo, além de
depender de imagens de satélite.
Outra proposta de compatibilização pode ser vista em Chein et al. (2004) apud
Souza (2007). Os autores fazem a re-agregação de dados de três formas: grupos
de municípios criados a partir daqueles existentes no ano-base; grupos cuja
origem não é do ano-base, mas posterior; e grupos de municípios criados a
partir de mais de uma localidade. O último grupo é re-agregado seguindo o
modelo de polarização. O método tem a vantagem de manter os mesmos municípios
do ano-base, mas a forma de re-agregação obedece aos recortes políticos. Isso
limita a re-agregação de dados a um município polarizador que está em outro
Estado, por exemplo.
Umbelino e Barbiere (2008) apresentam uma proposta de compatibilização no nível
de setor censitário. Tal grau de detalhamento é muito útil na escala urbana,
uma vez que facilita, sobremaneira, o planejamento de uma cidade. Para análises
que envolvem os municípios de um Estado ou do país, isso não é necessário,
porém, são requeridas ponderações das variáveis censitárias.
Neste trabalho, propõe-se um método alternativo de análise com AMC, aplicando
os Polígonos de Voronoi ' PV e um método para agregar os dados por ponderação.
Espera-se que esses métodos atenuem os problemas citados, já que levam em conta
a distância geográfica, distribuem as variáveis com ponderações e mantêm a
amostra do ano-base. A utilização de PV tem a vantagem de determinar as AMC com
base nas áreas de influência que cada município gerador tem sobre os novos
municípios, sem a limitação das divisões políticas. Para isso, faz-se uso de
Sistema de Informações Georreferenciadas ' SIG, amplamente difundido em
diversas áreas do conhecimento. Num SIG, todas as informações são armazenadas
num banco de dados e alocadas em pontos de um mapa, que pode ser um município,
zona, região, entre outras formas (MONMONIER, 1997).
Uma vez construídas as AMC por meio de PV, ponderam-se os dados das variáveis
censitárias nessas AMC. Essa abordagem permite reduzir os vieses dos testes
estatísticos. A variável salário, por exemplo, se apenas somada como no método
AMC/ Ipea, gera valores muito elevados para as AMC com maior número de
agregações. Por outro lado, os municípios que não foram desmembrados continuam
com seus valores originais e as AMC de menor agregação ficam com valores
intermediários. Neste caso, o peso da variável salário seria expressivamente
alterado entre as localidades e a média das observações seria superestimada. Ou
seja, a variação dos salários em uma localidade é muito superior à de outra
localidade, quando poderia ser a mesma. Essas disparidades geram parâmetros
viesados, que podem ter seus valores subestimados, superestimados ou sinais
invertidos.
No intuito de testar os métodos propostos, busca-se avaliar as mudanças
populacionais ocorridas na Região Norte, entre 1980 e 2000, à luz da Nova
Geografia Econômica ' NGE, comparando-os com o método de AMC por divisão
territorial, adotado pelo Instituto de Pesquisa Econômica Aplicada ' Ipea. A
Região Norte é a maior do país, onde as diferenças geográficas e
socioeconômicas são bastante acentuadas em relação ao resto do Brasil.
Adicionalmente, segundo Reis et al. (2008), é nesta região que ocorreu o maior
número de desmembramentos territoriais.
Para atingir os objetivos desse trabalho, faz-se necessário construir as AMC
para compatibilizar os censos de 1980 e 2000. Desse modo, adotam-se o método
das AMC do Ipea (AMC/Ipea) e o método aqui proposto, os Polígonos de Voronoi
(AMC/ PV). No intuito de validar a proposta deste artigo, comparam-se esses
dois métodos, aplicando-os à Região Norte do Brasil. Para isso, utilizam-se
variáveis censitárias que, de acordo com a NGE, influenciam nas aglomerações
populacionais. O teste será feito via método econométrico de Mínimos Quadrados
Ordinários. Espera-se obter resultados mais confiáveis a respeito do
comportamento das variáveis socioeconômicas.
Em síntese, este artigo está estruturado da seguinte forma: além dessa
introdução, na seção a seguir são apresentados os antecedentes do crescimento
populacional na Região Norte e a definição das AMC e dos polígonos de Voronoi;
na seção seguinte é descrita a metodologia, na qual são demonstrados os
procedimentos para redistribuir os dados censitários nas AMC, bem como o método
econométrico para avaliar o crescimento populacional; posteriormente, são
discutidos os resultados e, na última seção, apresentam-se as conclusões.
Fundamentação
A Região Norte, composta por sete Estados (Acre, Amapá, Amazonas, Pará,
Rondônia, Roraima e Tocantins), é a maior do Brasil em extensão, com uma área
de 3,9 milhões de quilômetros quadrados, que representam cerca de 42,3% do
território brasileiro, e registra uma das maiores taxas de crescimento
populacional do país nas últimas décadas. Em 1985, por exemplo, sua população
respondia por 6,21% da população brasileira, aumentando para 8,04%, em 2006,
com um incremento de 29,6%. Seu processo de urbanização é igualmente
diferenciado, com elevada concentração em algumas capitais. Manaus, por
exemplo, detém 51% da população do Estado; Macapá, 59,8%; Boa Vista, 62%; Rio
Branco, 46% (CONSIDERA; MEDINA, 1998; SILVA; MEDINA, 1999; IBGE, 2008; SILVA,
2009).
Esse crescimento, além de não ser homogêneo, está associado à maturação dos
investimentos públicos e aos incentivos fiscais concedidos nas décadas de 1960
e 1970. Isso impulsionou o aumento populacional a partir de fins dos anos 1970
e por toda a década 1980. Contudo, a imigração acelerada nesse período teve
redução substancial nos anos 1990 e 2000, pouco contribuindo para o aumento
recente da população, que se deve, basicamente, ao crescimento vegetativo. Por
outro lado, a migração intrarregional teve incremento expressivo, decorrente da
exaustão de recursos naturais, concentração fundiária, processo de mecanização
nas zonas rurais, aumento das áreas dedicadas à pecuária e expansão da
fronteira agrícola e mineral (BRASIL, 1997; OLIVEIRA; SIMÕES, 2004). Tal
processo ocasionou aumento da população das cidades, com forte migração das
zonas rurais para urbanas (GOLGHER; MARQUES, 2006). Conforme preconiza a NGE,
esse fluxo migratório às cidades está ligado à procura por qualidade de vida,
amenidades urbanas, renda e acessibilidade a bens e serviços (FUJITA et al.,
2002; GLAESER et al. 1995, 1998).
O cenário descrito desperta interesse em analisar o crescimento populacional da
Região Norte no nível municipal. No entanto, existem alguns fatores que
dificultam essa análise, que estão diretamente ligados às mudanças territoriais
na região, descritas na seção seguinte.
As Áreas Mínimas Comparáveis ' AMC
Durante o período analisado, ocorreram expressivas modificações geográficas na
Região Norte. Alguns municípios foram incorporados a outros, assim como foram
criados novos. A maior parte dessas modificações deve-se à elevação de
categoria de Território para Estado, como Rondônia, em 1982, Amapá e Roraima,
em 1991, e o desmembramento do Estado de Goiás para gerar o Tocantins, em 1989.
O mesmo processo ocorreu com a criação de novos municípios, desmembrados
daqueles existentes em 1980. Essas mudanças ocasionaram problemas de
comparações intercensitárias (REIS et al., 2008).
Sob esse aspecto, analisar o comportamento de uma variável de um município que
foi desmembrado para gerar outros é uma tarefa complexa. Por isso, a solução
usualmente encontrada se dá por meio de AMC, as quais apresentam algumas falhas
que causam vieses nos testes estatísticos. Análises de variações devem ser
feitas tomando o período inicial como base e repetindo essa base nos períodos
seguintes.
No caso da Região Norte, em 1980 havia 205 municípios e, com as mudanças
territoriais, esse número aumentou para 449, em 2000 (IBGE, 1982, 2002). Por
conseguinte, para que as variações sejam consistentes, deve-se considerar o ano
2000 com mesmo número de municípios de 1980. Esse é um grande problema ao se
utilizar o método AMC/Ipea. Para obter as AMC, os dados são somados de acordo
com a divisão territorial. Contudo, isso reduz a amostra. Por AMC/PV, a
agregação é feita, mas preservando a base.
Os dados de AMC utilizados no Brasil, oferecidos pelo Ipea, abrangem de 1872
até 2000 (REIS et al., 2008). Grande parte dos trabalhos aplicados, que lidam
com o problema das AMC, utiliza essas séries de tempo. Ocorre que a metodologia
adotada para compor as AMC não permite produzir resultados plenamente
satisfatórios em análises de dados espaciais. De fato, o agrupamento leva em
consideração a divisão territorial dos municípios3 e não a proximidade entre as
cidades. Para análise de dados que envolvem a influência do espaço geográfico,
é preciso considerar a divisão territorial, a proximidade geográfica e manter a
amostra do ano-base, do contrário as taxas de variações dos dados ficam
distorcidas.
Esse problema pode ocorrer quando dois ou mais municípios, cujas cidades-sede
estão relativamente distantes uma da outra, são agrupados numa mesma AMC. Tal
como mostra a Figura_1, os municípiosm1, m2 e m3 possuem pequenas aglomerações
populacionais em zonas rurais e distritos, identificadas pelos círculos. Os
municípios m1 e m2 foram desmembrados para gerar o município n1 e o município
m3 foi desmembrado para gerar os municípios n2 e n3. Então, m1, m2 e n1 mais
suas respectivas zonas rurais e distritos compõem a AMC1, enquanto m3, n2 e n3
mais suas zonas rurais e distritos formam a AMC2.
Conforme mostra a primeira ilustração, duas zonas rurais do município m1
(círculos escuros) estão mais próximas da sede do município m3 do que da sua
própria sede. O mesmo pode ser observado para o município m2, que tem uma de
suas zonas rurais mais próxima da sede de m1. Na ilustração, as duas zonas
rurais do município m1sofrem mais influência da sede de m3, sendo que ambas as
sedes estão em AMC diferentes. Logo, havendo migração da zona rural de m1para
m3, esta não seria captada pelo método de cálculo da AMC usual. Isso distorce,
inclusive, a taxa de variação das variáveis censitárias, pois a AMC1 poderia
apresentar elevadas variações negativas e a AMC2, elevadas variações positivas.
Os PV resolvem o problema da proximidade, visto que permitem identificar as
áreas de atração dos municípios m1, m2 e m3. Essa área de atração pode também
ser chamada de AMC, uma vez que agrupa os novos municípios em áreas comuns, de
acordo com a proximidade com seu município gerador. Todo esse processo é feito,
automaticamente, pelo SIG. Complementarmente, este método é o mais indicado
para mapear valores de variáveis como população e produto, por exemplo, as
quais não variam suavemente (LLOYD, 2007).
O Polígono de Voronoi ' PV
Dado um conjunto de pontos no plano euclidiano, existe um conjunto associado de
regiões em torno desses pontos. Assim, todos os locais dentro de determinada
região estão mais próximos de um dos pontos do que de qualquer outro ponto.
Estas regiões podem ser consideradas o dual do conjunto de pontos e são
conhecidas como polígonos de proximidade, polígonos de Voronoi, regiões de
Thiessen ou Dirichlet Cell (DIRICHLET, 1850; VORONOI, 1909; THIESSEN, 1912 apud
KOLAHDOUZAN; SHAHABI, 2004).
O conjunto de localizações designado para cada ponto gerador4 forma uma região
chamada de PV do ponto gerador p. O conjunto de PV associado a todos os
geradores é chamado de diagrama de Voronoi (Figura_2). São coletivamente
exaustivos, pois cada localização está associada com pelo menos um ponto
gerador. São mutuamente excludentes, isto é, não têm intersecção, exceto para
os seus limites.5 Os limites dos PV, chamados de arestas de Voronoi, são o
conjunto de locais que podem ser atribuídos a mais de um gerador. A distância
entre os pontos geralmente é calculada em linha reta, no espaço euclidiano.
Dessa forma, o PV associado ao ponto gerador pi é dado pelo conjunto chamado de
Diagrama de Voronoi gerado por P, como ilustra a Figura_2.

Esses diagramas possuem algumas propriedades que representam a base para o
modelo utilizado nesse trabalho:
* o diagrama de Voronoi de um conjunto de pontos P é único;
* dois pontos pi e pjsão vizinhos caso dividam uma mesma aresta;6
* seja n o número de pontos geradores e ne o número de arestas de Voronoi,
então, ne < 3n ' 6, isto é, o vértice é representado pela intersecção de
três arestas que são equidistantes a três pontos geradores;
* considerando a propriedade anterior e o fato de que cada aresta de
Voronoi é compartilhada exatamente por dois PV (propriedade 2), nota-se
que o número médio de arestas por polígono é de aproximadamente 6, isto
é, 2(3n-6)/n = 6-12/n < 6, a qual significa que, na média, cada gerador
possui seis geradores adjacentes.7
Essa última propriedade é utilizada para derivar o algoritmo desse trabalho,
que segue Kolahdouzan e Shahabi (2004) e Okabe et al. (1992).
Aplica-se um Diagrama de Voronoi em Redes, no qual a distância entre dois
pontos no espaço é calculada pelo caminho ou pelo tempo mais curto de
deslocamento, em vez da distância euclidiana. Por essa extensão do diagrama de
Voronoi, a rede espacial pode ser modelada como grafos ponderados,8 nos quais
as intersecções são representadas pelos nodos do grafo e as rodovias e
hidrovias são representadas pelas ligações entre os nodos. Os pesos podem ser a
distância entre os nodos ou o tempo de viagem entre eles.
Na Figura_3, P1, P2 e P3 são os pontos geradores, que representam as cidades
existentes em 1980. Os demais pontos correspondem aos municípios criados a
partir de 1980, ligados por uma rede de rodovias ou hidrovias que estão
conectadas umas às outras. Cada estilo de linha no diagrama corresponde a um
conjunto de links de Voronoi de um gerador. Alguns links estão completamente
contidos na área de um gerador, divididos pela linha mais espessa. O link
conectando P6 e P9, por exemplo, está totalmente dentro da área9 de P1,
enquanto outros estão parcialmente contidos em diferentes áreas, como é o caso
do link que conecta P4 e P5, por exemplo, que está dividido entre as áreas de
P1 e P2. Esse esquema representa a forma com que será desenvolvida a estrutura
dos PV desse artigo.
[/img/revistas/rbepop/v28n1/a07fig03.jpg]
Fonte de dados e metodologia
Para a construção das AMC de 1980 a 2000, foram utilizadas as genealogias
municipais publicadas pelo IBGE e outras fontes complementares, como leis
estaduais e ajustamento da base territorial para comparação de dados dos
censos, em Bremaeker (2006). A base de dados foi construída a partir dos censos
demográficos de 1980 e 2000. O recorte regional são todos os municípios da
Região Norte. O mapa da divisão territorial e do sistema de transporte de 1980
foi digitalizado, tendo como base o mapa de 198210 e 2006, disponibilizado pelo
Departamento Nacional de Infraestrutura de Transporte ' DNIT. As variáveis
utilizadas para explicar o processo de aglomeração com base na NGE seguem a
literatura, como em Partridge (2007), Andersen et al. (2002) e Souza (2008), e
são detalhadas na seção do método econométrico.
A metodologia está dividida em três partes. Na primeira, são construídas as AMC
no padrão do Ipea, seguindo Reis et al. (2008). Por AMC/PV, é colocado o mapa
de 2000 sobre o de 1980. Dessa maneira, têm-se os municípios geradores e os
gerados. O programa de georreferenciamento irá identificar as áreas de
influência dos municípios de origem. Estas deverão abranger, ou não, certos
municípios. O importante é que as AMC são criadas a partir da base, isto é, um
processo do início para o fim, que mantém a amostra inicial. Em seguida, faz-se
a agregação das variáveis censitárias utilizadas no método econométrico. A
agregação é feita por soma, no método AMC/Ipea e, por ponderação, no AMC/PV. Na
última parte, com as AMC definidas e as variáveis devidamente alocadas,
utiliza-se o método econométrico de MQO para avaliar o crescimento
populacional, comparando os dois modelos de AMC.
Ponderações dos dados nas AMC/Ipea e AMC/PV
Hipoteticamente, consideram-se os municípios m1e m2com população p1e p2em 1980.
Estes municípios foram desmembrados e geraram quatro novos (m3, m4, m5 e m6).
Os municípios m3, .. , m6 foram criados com áreas tanto de m1quanto de m2. Por
essa lógica, para compor a AMC com os dados censitários de 2000, por exemplo, a
população desta área seria a soma da população de todos os municípios p1 +
..... + p6. Supondo-se que a participação da população de m1 e m2 em 1980 seja
de 30% e 70%, com o aumento do número de municípios em 2000, essa participação
cai para 10% e 40%, respectivamente. Há então 50% de população que precisa ser
redistribuída entre m1 e m2 de forma que seja possível calcular a variação
populacional sobre a mesma base.
Conseqentemente, é necessário considerar a proporção da perda real de população
dos municípios de origem. No exemplo anterior, m1 perdeu 67% de sua população e
m2, 43%. Há também a migração dos habitantes das zonas rurais para urbanas,
processo este que se intensificou nas últimas décadas (GOLGHER; MARQUES, 2006).
Uma possível maneira de suavizar esses problemas é distribuir a população
excedente com base na estrutura populacional das AMC em 2000, entre rural e
urbana. Desse modo, a população excedente é distribuída levando em conta o
dinamismo populacional no decorrer do período em análise. Para tanto, calcula-
se a distribuição relativa da população rural e urbana do município i no
instante t, isto é, no ano 2000. O sobrescrito o identifica esse município como
existente no ano-base, em 1980. Trata-se de um município que foi desmembrado '
aqui chamado de município original ' para gerar outros municípios. Assim:
[/img/revistas/rbepop/v28n1/a07frm01.jpg]
em que [/img/revistas/rbepop/v28n1/a07img01.jpg] é a participação relativa da
população rural do município original i, no instante t; [/img/revistas/rbepop/
v28n1/a07img02.jpg] é a população rural do município original i e [/img/
revistas/rbepop/v28n1/a07img03.jpg] é a população urbana do município original
i. O mesmo se aplica à população urbana:
[/img/revistas/rbepop/v28n1/a07frm02.jpg]
em que [/img/revistas/rbepop/v28n1/a07img04.jpg] é a participação relativa da
população urbana do município original i.
Para redistribuir a população excedente, extrai-se a participação relativa do
município original em relação à sua AMC na composição do ano t.
[/img/revistas/rbepop/v28n1/a07frm03.jpg]
onde [/img/revistas/rbepop/v28n1/a07img05.jpg] é a participação da população
rural do município original i em relação à população rural total da AMC,
identificada pelo subscrito A; [/img/revistas/rbepop/v28n1/a07img06.jpg] é a
população rural original da AMC A. O mesmo se aplica à população urbana:
[/img/revistas/rbepop/v28n1/a07frm04.jpg]
em que [/img/revistas/rbepop/v28n1/a07img07.jpg] é a participação da população
urbana do município original i em relação à população urbana total da AMC A em
t. Com a participação relativa em relação à AMC A em (3) e (4), obtém-se a
distribuição da população excedente rural e urbana, identificada pelo
sobrescrito E, da seguinte forma:
[/img/revistas/rbepop/v28n1/a07frm05.jpg]
em que [/img/revistas/rbepop/v28n1/a07img08.jpg] é a população rural do
município original i, adicionada da população rural excedente dos municípios
criados entre 1980 e 2000. O sobrescrito d identifica que essa é a população
obtida a partir da soma da população original mais a excedente; [/img/revistas/
rbepop/v28n1/a07img02.jpg] é a população rural do município original i; [/img/
revistas/rbepop/v28n1/a07img05.jpg] é a participação relativa da população
rural desse município em relação à população da AMC A, obtida em (3); e [/img/
revistas/rbepop/v28n1/a07img09.jpg] é a população rural excedente E, da AMC
Ados municípios criados a partir de 1980. O mesmo se aplica à população urbana:
[/img/revistas/rbepop/v28n1/a07frm06.jpg]
Por fim, a população dos municípios originais adicionada da população excedente
conforme (5) e (6) deve ser distribuída na mesma estrutura de (1) e (2). Por
meio desse método, a nova população distribuída fica mais próxima da realidade
apresentada em 2000. Logo:
[/img/revistas/rbepop/v28n1/a07frm07.jpg]
onde [/img/revistas/rbepop/v28n1/a07img10.jpg] e [/img/revistas/rbepop/v28n1/
a07img11.jpg] constituem a nova população rural e urbana dos municípios
originais iadicionados a partir da distribuição dfeita em (4) e (5). O
sobrescrito do representa a nova distribuição populacional ddos municípios
originais o. Desse modo, é possível realizar a análise de variação populacional
sobre a mesma base, agora que a população dos municípios criados entre 1980 e
2000 foram devidamente "devolvidas" (distribuídas) aos municípios que lhes
deram origem. Esse método capta tanto a perda de população resultante do
desmembramento, como o movimento migratório intermunicipal de zonas rurais e
urbanas.
Método econométrico
A finalidade do modelo econométrico é comparar a performance dos ajustamentos
das AMC/Ipea e AMC/PV. Por conseguinte, serão estimados quatro modelos: dois
(rural e urbano) aplicados às AMC/Ipea e o mesmo para AMC/PV. A divisão dos
modelos entre rural e urbano visa captar os efeitos de mudanças populacionais
isoladamente. Isso facilita a interpretação dos dados à luz da NGE, cujo um de
seus pressupostos versa sobre os processos de aglomerações populacionais. O
modelo rural aplicado em ambos os métodos de AMC é o seguinte:
[/img/revistas/rbepop/v28n1/a07frm09.jpg]
em que POPré a variação da população rural no município i; MIG (migração da
zona rural para urbana); FEC (taxa de fecundidade); IDH(Índice de
Desenvolvimento Humano); SAR (salários pagos nas zonas rurais); ITR (iteração
do diferencial de salário com a área total de terras utilizadas); OFE (área
total dedicada à agropecuária e pecuária);ε(termo de erro) e as demais letras
gregas representam os coeficientes a serem estimados.
O modelo urbano para AMC/Ipea e AMC/PV é o seguinte:
[/img/revistas/rbepop/v28n1/a07frm10.jpg]
onde POPué a taxa de variação populacional na zona urbana, no município i; SAU
(salários pagos nas zonas urbanas); DSL(proporção dos salários pagos nas zonas
urbanas em relação à rural).11
Nesses modelos, a variável MIGé uma proxy que capta a mudança da população
rural para urbana, gerando os processos aglomerativos preconizados pela NGE
(FUJITA et al. , 2002). Este processo foi intensificado a partir dos anos 1990,
com o crescimento econômico das cidades; logo, espera-se sinal negativo no
modelo rural e positivo no urbano, indicando que quanto mais atrativas forem as
cidades, mais pessoas se deslocam da zona rural para urbana.
A variável OFE do modelo rural é uma proxy para captar o movimento migratório
interestadual. Em fins da década de 1970 e na de 1980, a onda migratória para a
Região Norte foi intensa, com decréscimo nos anos 1990. Parte dessa onda
migratória foi ocasionada pelos incentivos do governo federal, por meio da
reforma agrária, disponibilizando terras em todos os Estados daquela região.
Apesar da expansão da área dedicada à pecuária, esperam-se coeficientes
positivos para essa variável, indicando que, quanto maior for a oferta de
terras na Região Norte, maior é o crescimento populacional rural.
Em contraste, a variável CONcapta os efeitos de concentração da propriedade,12
o qual reduz a oferta de emprego, estimulando o movimento rural-urbano.
Complementarmente, a variável ITR(iteração da oferta de terras com o
diferencial de salários) deverá captar as vantagens ou desvantagens da migração
rural-urbana.
A variável FEC será usada como proxypara o crescimento vegetativo,13 da qual se
espera sinal positivo. O IDH reflete as condições de vida da população urbana,
no nível de renda, educação e saúde. Espera-se sinal negativo no modelo rural e
positivo no urbano. (MARTINS; ALMEIDA, 2000; MOREIRA, 2000). As variáveis SARe
SAUservirão como proxies para captar a força de atração da renda em ambas as
zonas. O sinal esperado é positivo, indicando que, quanto maior for o salário,
maior é o poder de atração de trabalhadores, contribuindo para a aglomeração
(ELLISON; GLAESER, 1999). No modelo rural, a variável MEC (mecanização)14
contrasta com os salários, isto é, por mais que os salários sejam atrativos nas
zonas rurais, o processo de mecanização impede que a oferta de trabalho seja
expandida; logo, espera-se sinal negativo dessa variável.
O modelo econométrico será estimado por MQO, com todas as variáveis expressas
em taxas logarítmicas. O período de variação é de 1980 a 2000, com taxas
calculadas da seguinte forma: ln(x)2000-ln(x)1980. Isso evita correlações
espúrias, além de o período de tempo relativamente longo evitar, também,
problemas de endogeneidade (BAUM, 2006). Por serem dados cross-section, é
provável que a hipótese de homocedasticidade seja violada, a qual gera
estimadores de MQO viesados e não eficientes (GREENE, 2002). Para evitar essa
falha, o modelo será estimado na versão robusta, significando que, nessa
abordagem, não se impõe nenhuma restrição ao comportamento dos erros do modelo
(BAUM, 2006).
Resultados
Na Região Norte havia, em 1980, 205 municípios, número que passou para 449, em
2000. Os 244 novos municípios foram originados a partir tanto de um único
município, como de mais de um. Pelo método AMC/Ipea, os novos municípios são
re-agregados àqueles de origem, formando as AMC.
Como exemplo dos resultados,15 mostra-se o caso de Nova Rosalândia (último
diagrama da coluna do meio, da Figura_4), no Estado do Tocantins. Este
município foi emancipado em 1988, desmembrado dos municípios de Cristalândia,
Porto Nacional e Fátima. O município de Fátima foi emancipado em 1982, a partir
do município de Porto Nacional, que, por sua vez, também deu origem aos
municípios de Ipueiras, Silvanópolis e Palmas.
Seguindo a lógica da divisão territorial para criar as AMC, a área de Nova
Rosalândia é somada à área de Fátima, Cristalândia e Porto Nacional.
Entretanto, Cristalândia gerou Aliança do Tocantins, que gerou Cri-xás do
Tocantins. O município de Aliança do Tocantins foi também gerado com áreas de
Brejinho de Nazaré e Gurupi. Brejinho de Nazaré gerou Santa Rita do Tocantins e
Gurupi e este, por sua vez, gerou Cariri do Tocantins, o qual foi também gerado
por Dueré. Porto Nacional também gerou outros três municípios, além de Fátima e
Nova Rosalândia. Nessa rede de municípios, todas as áreas são somadas, formando
uma grande AMC, como demonstrado na Figura_4. Esse processo se repete para
todas as AMC. As variáveis socioeconômicas são alocadas nessas AMC, obedecendo
ao mesmo processo de soma, pelo método AMC/Ipea.
Apesar da simplicidade dessa forma de agregação, a análise das variáveis
socioeconômicas perde poder explicativo, porque, primeiro, o número da amostra
fica reduzido e, segundo, os centroides dos municípios em 1980 estão
relativamente distantes um do outro. Aliança do Tocantins, por exemplo, faz
parte da AMC da Figura_4, desmembrado do município de Brejinho de Nazaré a 63
km de distância, Cristalândia, a 116 km e Gurupi, a 50 km. Observando os PV na
Figura_5, nota-se que o município de Aliança do Tocantins está no mesmo
polígono de Dueré. Isso ocorre porque eles estão separados por apenas 49 km de
distância. Da mesma forma, Ipueiras, que embora tenha sido desmembrado de Porto
Nacional, está muito mais próximo de Brejinho de Nazaré. Consequentemente, por
questão de proximidade, é mais provável que o município de Aliança do Tocantins
sofra mais influência de Dueré e Gurupi, assim como Ipueiras sofra mais
influência de Brejinho de Nazaré, conforme demonstrado no Diagrama de Voronoi
(Figura_5).
Com efeito, um grande centro urbano pode ter mais influência sobre uma cidade
que está a 200 km distância do que sobre outra a apenas 50 km, por exemplo.
Obviamente, o município mais próximo deveria sofrer maior influência do centro
urbano e não o contrário. Os PV contornam os problemas citados.
Por meio desse método, todos os municípios de origem são preservados, neste
caso, 205. O mesmo não acontece com o AMC/Ipea, cuja amostra será sempre
inferior,16 reduzindo, inclusive, o poder explicativo dos regressores. Os 244
novos municípios são re-agregados àqueles de origem, de acordo com sua
proximidade nos PV, como demonstrado nas Figuras_5 e 6. As variáveis
socioeconômicas, por sua vez, são realocadas seguindo o método da ponderação.
A agregação por AMC/Ipea, conforme representada pela Figura_4, totalizou 79 AMC
para a Região Norte. Na forma de polígono, como da Figura_5, o total é de 91.
Seguindo o método de agregação AMC/Ipea, o Estado do Acre tem seis AMC,17 nas
quais estão agregados 19 municípios, enquanto três municípios não sofreram
nenhuma alteração territorial. Logo, há uma amostra de nove localidades. Pela
aglomeração feita por PV, foram construídas nove AMC que agrupam 20 municípios,
totalizando uma amostra de 12 localidades (3+9). Uma diferença fundamental
entre os modelos é que por AMC/ Ipea, há a limitação territorial e, por AMC/PV,
vale a proximidade. Dessa maneira, a AMC de um Estado pode agregar um município
de outro Estado. Isso é fundamental, porque os indivíduos migram para onde o
custo-benefício é mais vantajoso. O município de Guajará, por exemplo,
localizado no extremo sudoeste do Amazonas, está muito mais próximo de Cruzeiro
do Sul, no Acre, do que de seu município "mãe". Por isso, foi incorporado na
AMC de Cruzeiro do Sul,18 sendo esta a cidade atrativa de migração.
No Amazonas, foram construídas dez AMC por AMC/Ipea, aglomerando 38 municípios.
Na amostra, 24 municípios não foram desmembrados, totalizando 34 localidades
(10+24). Por AMC/PV, foram construídas 13 AMC que agregam 29 municípios, mais
31 municípios que não foram incorporados a nenhuma AMC, somando 44
localidades.19 No Amazonas e Pará, as áreas dos municípios são muito extensas
e, por essa razão, muitos não foram incorporados a nenhuma AMC, seguindo o
método AMC/PV. Essa distância implica que não havia nenhuma cidade próxima o
suficiente que pudesse influenciar, ou sofrer qualquer influência desses
municípios. Nos Estados do Amapá e Roraima, não houve diferença de aglomerações
entre os métodos empregados.
O Estado do Pará apresentou 25 AMC por AMC/Ipea, que agrupam 92 municípios,
enquanto 51 não foram desmembrados, totalizando 76 localidades (25+51). Por
AMC/PV, foram construídas 24 AMC que agrupam 80 municípios, enquanto 59 não
foram alterados, totalizando 83 localidades (24+59). Tal como ocorreu no
Amazonas, alguns municípios do Pará foram mantidos isolados por não
influenciarem os novos municípios, devido às longas distâncias que os separam.
Ainda, o município de Santa Maria das Barreiras foi incorporado à AMC do
município de Araguacema-TO; Brejo Grande do Araguaia e Palestina do Pará foram
incluídos na AMC de Araguatins-TO; Piçarra e São Geraldo do Araguaia, na AMC de
Xambioá-TO. Então, incorporaram-se quatro municípios às AMC do Tocantins e um à
AMC do Amazonas.
No Tocantins foram construídas 35 AMC pelo método AMC/Ipea, com 129 municípios
agregados. Somam-se a esse resultado dez municípios que não sofreram divisões
territoriais, totalizando amostra de 45 localidades (35+10). Por AMC/PV, foram
construídas 45 AMC que agregam 137 municípios, enquanto sete foram mantidos
inalterados, totalizando 52 localidades (45+7).
Comparação de desempenho dos modelos
Na Tabela_1 estão descritos os resultados da estimação obtidos no modelo para
zona rural, no qual a variável resposta é o logaritmo da variação da população
nas zonas rurais. O conjunto de dados contém as variáveis que se espera
influenciar nas variações populacionais, negativa e positivamente. A primeira
coluna mostra que o modelo rural com AMC/Ipea não foi tão bem ajustado quanto
aquele com AMC/PV. As variáveis utilizadas explicam 58,4% das variações na
aglomeração populacional, contra 77% no modelo de AMC/PV. A variável
fecundidade foi a única que não mostrou evidência de poder explicativo nos dois
modelos, talvez pela sua própria redução ao longo do tempo, pela importância
crescente de outras variáveis, como salários e IDH, e pela migração para zonas
urbanas.
Como salientado, o modelo por AMC/ Ipea pode gerar alguns vieses e os
resultados da regressão demonstram isso. O coeficiente da variável IDH parece
estar superestimado, com elevada elasticidade; a iteração entre oferta de terra
e diferencial de salário, que deveria ser negativa, no entanto é positiva. O
mesmo se aplica ao coeficiente da variável concentração de terras. No modelo
AMC/PV, a regressão não só foi mais bem ajustada, como também apresentou os
sinais de acordo com a teoria. A variável de maior impacto na redução da
população rural, de acordo com o modelo AMC/PV, é o IDH. Isso significa que as
pessoas das zonas rurais estão migrando em busca de melhor qualidade de vida,
supostamente alcançada nas zonas urbanas.
Embora o impacto dos salários pagos nas zonas rurais seja ainda expressivo em
aumentar a população rural, há forças contrárias atuando. Apesar de a oferta de
terra ainda ter efeitos positivos, o baixo coeficiente dessa variável dá sinais
de enfraquecimento da demanda por trabalho nas zonas rurais (para cada aumento
de 1% na oferta de terras, a população rural aumenta apenas 0,08%). Esse
enfraquecimento pode ser resultado da concentração de propriedade, utilização
das terras para pastagens e inserção de empresas capitalistas que mecanizaram a
produção no campo, exigindo cada vez menos mão de obra. De fato, os
coeficientes negativos dessas variáveis confirmam essa assertiva no modelo AMC/
PV, que estão plenamente de acordo com os resultados observados nos censos
agropecuários. Apesar disso, os resultados do modelo AMC/Ipea indicam o
contrário, deixando claro o viés dos resultados.
De acordo com o exposto, evidenciou-se que o modelo AMC/PV explica melhor as
variações populacionais nas zonas rurais, tanto pela sua qualidade de
ajustamento quanto pelos coeficientes das variáveis explanatórias.
Para explicar as aglomerações nas zonas urbanas, utilizou-se como variável
dependente o logaritmo da variação populacional nas zonas urbanas. A partir da
teoria, espera-se que todas as variáveis explanatórias utilizadas influenciem,
positivamente, o crescimento populacional nas zonas urbanas. Na Tabela_2, estão
descritos os resultados da estimação obtidos no modelo para zona urbana, no
qual a variável resposta é o logaritmo da variação da população nas zonas
urbanas. Todos os coeficientes apresentam os sinais esperados no modelo AMC/PV,
enquanto no modelo AMC/Ipea há três variáveis com coeficientes negativos. Além
disso, nota-se que o grau de ajustamento do modelo AMC/ Ipea é bastante
inferior ao do AMC/PV. Este explica apenas 35% das mudanças nas aglomerações
urbanas. No modelo AMC/ Ipea, o grau de ajustamento é de 79,2%.
[/img/revistas/rbepop/v28n1/a07tab02.jpg]
O crescimento da população urbana está estreitamente relacionado com os fatores
de redução da população rural. A variável proxy para a migração capta esse
efeito. Para cada aumento de 1% na migração rural, a população urbana aumenta
0,26%. Entretanto, no modelo AMC/Ipea esse efeito é contrário. O mesmo ocorre
com as variáveis diferencial de salários e IDH, que deveriam ser positivas,
mas, ao contrário, são negativas. No modelo AMC/ PV, para cada aumento de 1% no
diferencial de salário da zona urbana para zona rural, a população urbana
aumenta 0,46%. Vale destacar que, no modelo rural, a variável diferencial de
salário produziu melhor efeito quando realizada sua iteração com a oferta de
terra. Daí a razão de não constar essa variável isolada no modelo rural, já que
reduziria a parcimônia do modelo. Apesar do bom ajustamento do modelo AMC/PV, a
variável IDH, mesmo com o sinal esperado, não teve o mesmo impacto do que no
modelo rural. Deste modo, nas zonas rurais, a busca por qualidade de vida é de
grande importância, seja pela deficiência na educação, empregos, ou salários
menores. Em contrapartida, nas zonas urbanas, o efeito da busca por maiores
salários é mais forte. Grande parte desse efeito pode ser atribuído à migração
rural, que provavelmente está influenciando na importância da variável
fecundidade no modelo urbano.
Os resultados econométricos confirmam a hipótese da proposta de análise deste
artigo, de que as agregações de AMC comumente empregadas nos trabalhos
empíricos geram estatísticas pouco confiáveis. Além de mostrar melhor
ajustamento, o modelo de AMC/PV gerou estatísticas condizentes com os
pressupostos teóricos, tanto no modelo rural quanto no urbano.
Conclusões
Este trabalho teve como objetivo propor uma metodologia alternativa para lidar
com problemas de Áreas Mínimas Comparáveis com aplicações dos Polígonos de
Voronoi e agregação de dados por ponderação. O problema de AMC surge devido aos
desmembramentos territoriais dos municípios, que impossibilitam a análise de
variáveis socioeconômicas no tempo. O Ipea fornece séries de dados censitários
agregados por AMC, no entanto, o método de agregação segue o mesmo princípio de
agregação dos territórios, o qual gera viés nos testes estatísticos.
Para testar a eficiência do método aqui proposto, utilizou-se método
econométrico de MQO para compará-lo com o método adotado pelo Ipea. O teste
econométrico foi aplicado às aglomerações populacionais na Região Norte do
Brasil sob pressupostos da Nova Geografia Econômica, analisando a variação
populacional entre 1980 e 2000.
Foram construídas 103 AMC pelo método de Polígono de Voronoi e 79 utilizando a
metodologia do Ipea. Os dados censitários, que explicam as aglomerações
populacionais, foram distribuídos nos dois modelos de AMC. No modelo AMC/Ipea,
foi feita a soma e, no AMC/PV, realizou-se a ponderação conforme proposto neste
artigo.
O teste comparativo entre os dois modelos mostrou que o AMC/PV gera resultados
mais confiáveis e consistentes com a teoria empregada. O modelo AMC/Ipea
sugeriu que a variação populacional nas zonas rurais foi impactada
negativamente pelas migrações das zonas rurais para as urbanas, pelo IDH e pela
mecanização, sendo que esta última não foi significativa. Entretanto, este
modelo indicou como positiva a influência da variável diferencial de salário
iterada com a variável oferta de terras, quando deveria ser negativa. O mesmo
ocorreu com a variável concentração de propriedade, que, embora não
significativo, apresentou sinal contrário ao esperado. Por outro lado, no
modelo AMC/PV, os resultados mostraram-se de acordo com os pressupostos da
teoria da NGE. Neste caso, variáveis como a mecanização, concentração de terras
e diferencial de salário iteradas com a oferta de terras impactaram
negativamente no crescimento da população nas zonas rurais.
Quanto às variações das aglomerações urbanas, a diferença de resultados entre
os dois modelos é mais acentuada. No método AMC/Ipea, a variável de maior
impacto é a taxa de fecundidade, seguida pela variável salário, que, na
realidade, deveria ser a mais expressiva. A migração populacional das zonas
rurais para urbanas deveria apresentar sinal positivo, mas ocorreu o contrário.
Outra variável que supostamente deveria ser significativa apresentou sinal
contrário ao esperado: o diferencial de salários das zonas urbanas. No modelo
AMC/PV, as variáveis salário pago na zona urbana e diferencial de salário entre
as duas zonas são as que melhor explicam as aglomerações urbanas. A migração
das zonas rurais para urbanas também tem efeito expressivo. Nesse modelo,
somente a variável IDH não evidenciou fortes efeitos nas aglomerações.
Ademais, o modelo de AMC/PV apresentou melhor ajustamento dos dados. Com esse
desempenho, trabalhos futuros que visem análises espaciais com o uso de
Polígonos de Voronoi, seguramente, deverão apresentar resultados mais
satisfatórios, haja vista que por esta metodologia os dados são agrupados
seguindo a lógica dos efeitos espaciais de vizinhança, além de preservar a
quantidade de municípios existentes no período base, melhorando a qualidade das
estimações.