quarta-feira, 23 de março de 2011

Toponímia de Portugal

Geonames.org é um repositório online de dados toponímicos gratuítos ao abrigo da licença Creative Commons Attribution 3.0. A partir deste repositório podemos descarregar, em formato .txt, a informação toponímica de um dado país. Neste post farei uma demonstração daquela que me parece ser a forma mais simples de transformar estes dados em informação geográfica vectorial.




A partir do endereço http://download.geonames.org/export/dump/ vamos descarregar o ficheiro com as informações toponímicas do país que quisermos, neste caso Portugal (PT.zip). Uma vez extraído o ficheiro, há que converte-lo numa tabela em formato CSV para que possamos posteriormente abrir essa tabela com o QuantumGIS. Para isso abrimos o ficheiro PT com a folha de cálculo do Open Office . Aparecerá uma janela onde nos serão solicitadas algumas opções. Certifiquem-se que a codificação é UTF8 e que o separador é do tipo "tab":


O ficheiro será aberto sob forma de tabela, mas basicamente só nos interessam 3 colunas: o topónimo (coluna B), a Latitude/Y (coluna E) e a Longitude /X (Coluna F). Eliminamos todas as colunas excepto estas três e acrescentamos uma linha no topo de forma a nomearmos as colunas: "Toponimo"; "Y"; "X":


De seguida guardamos o ficheiro com a extensão CSV tendo o cuidado de assinalar a opção de "edit filter settings".

 
Aparece uma última janela com opções. Certifiquem-se com a codificação é a UTF8 e não se esqueçam do delimitador que vão escolher (neste caso uma vírgula)


Podemos fechar o folha de cálculo do Open Office. Agora vamos abrir o Quantum GIS. Certificamo-nos que o plugin Add Delimited Text Layer  está activo (poderão ter de ir a  Plugins --> Manage Plugins para tornar o ícone deste plugin visível) e, através desse plugin, vamos importar o CSV e transformá-lo num ficheiro geográfico.

À partida o plugin irá identificar automaticamente o delimitador e as colunas que contêm as coordenadas X e Y, mas convém sempre verificar...



Finalmente clicamos em OK e temos agora um layer com mais de 25.000 topónimos de Portugal Continental e Regiões Autónomas. Para finalizar a operação basta clicar com o botão direito sobre o layer que acabámos de criar e seleccionar Save As e escolher o formato e a directoria onde queremos guardar. Aconselho Shapefile (.shp) ou Keyhole Markup Language (.kml) por serem formatos standard que quase todo o software  aceita.


Não é preciso definir o Sistema de Coordenadas (CRS) porque o QGIS assume por default que é o WGS84 e neste caso está correcto - as coordenadas fornecidas no ficheiro .txt original estão neste sistema. Caso contrário teríamos de definir manualmente o CRS antes de salvar o layer.

Relativamente aos dados, confesso que não me deti muito na análise dos mesmos - limitei-me a fazer um zoom sobre a Região Oeste (a que conheço melhor) e pude verificar que os topónimos e respectiva localização estão correctos, sendo de destacar a quantidade de topónimos disponíveis. 

Nota: este exercício foi feito em ambiente Linux (Ubuntu 10.10). Mas deverá funcionar igualmente em ambiente Windows. Todo o software utilizado é aberto e também está disponível para Windows.

4 comentários:

  1. Após uma checkada numa zona onde conheço bastante bem a toponímia (Entroncamento, Torres Novas e Barquinha), tanto a nível dos populares, como da do IGP, posso dizer que está no mínimo, muito incorrecta. Aguardo feedback de outras zonas para perceber se está assim para o resto do país.

    Obrigado pelo link e help!

    Nuno Reis

    ResponderEliminar
    Respostas
    1. Olá Nuno,

      Um ano e meio depois, finalmente feedback!! De facto tens razão - há uma quantidade assinalável de topónimos (incluindo alguns sítios) mas a localização é normalmente desfazada - nalguns casos desvios na ordem dos km. Confirmo isto na Zona Oeste e em Trás os Montes, por isso julgo ser justo pressupor que para outras zonas não deverá ser muito melhor...

      Eliminar
  2. Só consegui ver meia duzia de topónimos e claro, fora da área que eu queria...

    ResponderEliminar