Descrição
Calcula estatísticas descritivas básicas para um ou mais campos numéricos em uma tabela de atributos. Essas ferramentas fornecem resumos quantitativos dos dados, ajudando a entender a distribuição, tendência central e dispersão dos valores, seja para toda a tabela ou para grupos específicos de registros.
Funções Principais / Ferramentas / Métricas
- Estatísticas Descritivas Básicas (para um campo):
- Count: Número total de registros (ou valores não nulos).
- Minimum (Min): O menor valor no campo.
- Maximum (Max): O maior valor no campo.
- Sum: A soma de todos os valores no campo.
- Mean (Média): O valor médio (soma dividida pela contagem).
- Standard Deviation (Desvio Padrão): Medida da dispersão dos valores em torno da média.
- Nulls: Contagem de valores nulos (ausentes).
- Median (Mediana): O valor central quando os dados são ordenados (menos afetado por outliers que a média). (Nem sempre disponível em todas as ferramentas básicas).
- Range (Amplitude): Diferença entre o máximo e o mínimo. (Nem sempre calculado explicitamente).
- Summary Statistics (Estatísticas Resumo): Calcula as estatísticas acima (e possivelmente outras) agrupando os resultados por categorias definidas em um ou mais campos (Case Fields). Gera uma nova tabela com os resultados sumarizados por grupo.
- Frequency (Frequência): Conta quantas vezes cada valor único (ou combinação de valores únicos) aparece em um ou mais campos (categóricos ou numéricos). Gera uma tabela de frequência.
- Estatísticas de Validação (Exemplo): Cálculo de métricas como RMSE (Raiz do Erro Quadrático Médio) ou MAE (Erro Absoluto Médio) se a tabela contiver valores previstos e observados de um modelo.
Exemplos Comuns
Verificar rapidamente o valor mínimo, máximo e médio da área dos lotes em uma camada (Statistics em um campo). Calcular a soma da população e a população média para cada região administrativa de uma cidade (Summary Statistics, sumarizando 'Populacao' agrupado por 'Regiao_Admin'). Contar quantos segmentos de estrada existem para cada tipo de pavimentação ('Asfalto', 'Terra', 'Paralelepípedo') (Frequency no campo 'Tipo_Pav'). Calcular o erro médio de um modelo de previsão de preço de imóveis armazenado em uma tabela (Statistics no campo de erro absoluto).