Descrição
Refere-se a ferramentas e técnicas projetadas para analisar e extrair informações de conjuntos de dados geoespaciais que são extremamente grandes, complexos ou que chegam em alta velocidade, excedendo a capacidade de processamento de ferramentas GIS tradicionais. Utiliza processamento paralelo e distribuído para lidar com o volume, variedade e velocidade dos dados.
Funções Principais / Ferramentas
- Processamento Distribuído: Executa análises dividindo a tarefa entre múltiplos núcleos de processador ou múltiplos nós de um cluster (ex: Spark).
- Análise de Padrões Espaciais em Larga Escala: Ferramentas otimizadas para Big Data que realizam análises como:
- Aggregate Points: Sumariza um grande número de pontos em polígonos (bins) regulares ou irregulares.
- Join Features: Realiza joins espaciais ou de atributos em conjuntos de dados massivos.
- Find Hot Spots: Identifica clusters estatisticamente significativos (hot spots e cold spots) em grandes volumes de dados pontuais ou agregados.
- Create Space Time Cube / Emerging Hot Spot Analysis (para Big Data): Versões otimizadas para lidar com grandes volumes de dados espaço-temporais.
- Density-based Clustering: Agrupa feições com base na sua proximidade em grandes conjuntos de dados.
- Fontes de Dados Comuns: Dados de GPS de frotas, dados de transações financeiras com localização, dados de sensores IoT em larga escala, logs de redes sociais georreferenciados, dados de rastreamento de dispositivos móveis.
- Plataformas e Ferramentas:
- ArcGIS GeoAnalytics Server / GeoAnalytics Engine: Plataforma Esri para análise distribuída.
- GeoAnalytics Desktop Tools (ArcGIS Pro): Ferramentas que utilizam processamento paralelo no desktop.
- Bibliotecas open-source como GeoSpark, Dask-GeoPandas integradas com Spark ou Dask.
Exemplos Comuns
Analisar bilhões de registros de GPS de veículos para identificar padrões de congestionamento e otimizar rotas em escala metropolitana. Identificar hotspots de criminalidade analisando milhões de registros de ocorrências ao longo de vários anos. Sumarizar dados de check-ins de redes sociais em escala nacional para entender padrões de mobilidade turística. Analisar dados de sensores de qualidade do ar de uma vasta rede IoT para mapear zonas de poluição em tempo quase real. Processar dados de rastreamento de navios (AIS) globais para análise de rotas marítimas.