Previsão com dados imperfeitos e modelo imperfeito

IoT that enables and not replaces your Workforce | The Element Podcast - E02 (Julho 2019).

Anonim

"A previsão é muito difícil, especialmente se for sobre o futuro", disse o Nobel Laureate Niels Bohr.

A pesquisadora de Argonne, Julie Bessac, e seu colega francês, Philippe Naveau, concordam - e eles empreenderam um estudo para talvez aliviar a dificuldade na avaliação da previsão do tempo. Seu artigo, intitulado "Avaliação de previsão com observações imperfeitas e modelos imperfeitos", concentra-se em novas métricas de avaliação de qualidade, regras de pontuação, para dar conta de erros em observações e previsões.

Esquemas de pontuação clássicos tipicamente envolvem a comparação de diferentes previsões com observações. Mas tais observações quase sempre apresentam erros - devido, por exemplo, a problemas de registro de dados ou a deficiências de instrumentos. De fato, um estudo recente mostrou que o escore de logaritmo clássico usado por tais esquemas é enganoso ao selecionar a melhor previsão quando erros de observação estão presentes, e que a distribuição probabilística dos dados de verificação deve depender de modelagem de processos físicos subjacentes que não são observados.

Com base nos resultados desse estudo, Bessac e Naveau propuseram um novo modelo de pontuação que combina previsões e distribuições de observação para corrigir uma pontuação quando os erros estão presentes nos dados de verificação e na previsão. Eles também destacaram a necessidade de investigar mais estatísticas do que a pontuação média que é comumente usada na prática.

A equipe comparou / formulou sua nova abordagem com dois modelos populares. O primeiro modelo ajuda a entender o papel e o impacto de erros observacionais em relação ao estado verdadeiro não observado da atmosfera X, mas não incorpora a idéia de erro de previsão. No segundo modelo, tanto as observações Y quanto as previsões Z são modeladas como versões com erros do estado da atmosfera X, o que não é mais observado.

"Distinguir entre a verdade não observada (processos ocultos) e os dados de verificação observados (mas incorretos) é fundamental para entender o impacto de observações imperfeitas na modelagem de previsão", disse Bessac, como assistente de estatística computacional na Divisão de Matemática e Ciência da Computação de Argonne.

O novo modelo oferece várias vantagens: (1) propõe uma estrutura simples para explicar erros nos dados de verificação e na previsão; (2) destaca a importância de explorar a distribuição das pontuações em vez de se concentrar apenas na média; e (3) mostra a importância de contabilizar erros nos dados de verificação que podem ser potencialmente enganosos.

O modelo foi testado em dois casos em que os parâmetros das distribuições envolvidas são assumidos como sendo conhecidos. Embora estes fossem casos idealizados, os pesquisadores enfatizaram que os resultados dos testes destacam a importância de investigar a distribuição dos escores quando os dados de verificação são considerados uma variável aleatória.

menu
menu