# Ata - Reunião Censo 23/12/2020
*Terça-feira, 23 de dezembro de 2020*
[TOC]
### Presentes
- [Ana Cecília](@IAA8H7ZURCejO-4Zz31Dug)
- [Bernardo](@bcbernardo)
- Giulio
## Revalidação de registros
A Ana relatou os argumentos pró-revalidação: consistência metodológica na base atual e alinhamento com os futuros mapeamentos, no que se refere aos critérios de validação. O Bernardo questionou se as eventuais inconsistências se referiam aos campos presentes no formulário de validação (data inicial dos diários, formato, fontes) ou apenas aos campos de texto livre "Observações" e "Anomalias".
Sobre os campos "oficiais" do formulário, a percepção relatada foi de que os critérios foram construídos relativamente cedo na pesquisa - conforme os casos duvidosos iam aparecendo, e antes que fossem validados para entrar na base. Uma vez tomadas, evitou-se sempre rever essas decisões, para manter a consistência metodológica. E os critérios foram comunicados para as pessoas envolvidas no mapeamento, por meio do FAQ, e, principalmente, para as pessoas validadoras, por meio das reuniões semanais, das atas das reuniões e das respostas a dúvidas no Discord.
Algumas inconsistências eventuais são possíveis nos campos do formulário - especialmente, na identificação do formato de publicação de portais que disponibilizam mais de um formato para acesso. Neste caso específico, porém, é possível resolver a maior parte dos problemas verificando se há inconsistências de classificação do formato para municípios com o mesmo domínio de portal - afinal, a maioria desses casos ocorrem em portais com múltiplos municípios.
Quanto aos critérios eventualmente considerados nos campos "Observações" e "Anomalias", a proposta mais organizada que temos até agora é a da @JTrevine :
> f) Observações:
> Diário desmembrado*: [S ou N]
> Link:
>
> = *DO desmembrado: quando não há um diário oficial, mas o conteúdo de um diário normal é pulverizado em seções decretos/portarias/licitações pelo site da pref
>
> ps.: precisa confirmar se oferece, mas não é necessário registrar > como < se confirmou que dado município não publica DO (se via LAI, envio de email, ligação, etc).
>
> g) Anomalia obs:
> recaptcha: [S ou N]
> site fora do ar ou instável: [S ou N]
> disponibilizado via nuvem (dropbox/drive): [S ou N]
A Ana e o Giulio pontuaram que qualquer alteração para incorporar esses critérios como parte do mapeamento deveria passar por uma modificação do formulário e por uma revalidação o mais breve possível - uniformizando a base antes de mapearmos mais municípios com uma metodologia diferente. No entanto, considerando os critérios adicionais propostos até aqui, tendemos a considerar que não justificavam o trabalho de uma revalidação:
- **Site fora do ar ou instável**: já está previsto como etapa da análise, a ser realizada de maneira automatizada (ver #41)
- **Presença de Captcha**: embora o ideal fosse ser um campo do formulário, para indicação durante o mapeamento, também é possível automatizar com a análise do HTML dos portais
- **Disponibilizado via nuvem (Dropbox/Drive...)**: não consideramos que seja um critério de alto interesse social
- **Diário "desmembrado"**: é aspecto técnico com alguma relevância para a modelagem dos dados no projeto Querido Diário, mas saber exatamente o percentual de diários nessa situação não gera um ganho muito maior para a tomada de decisão do uma simples estimativa de ordem de grandeza - que já temos com base na experiência do mapeamento. Além disso, sempre houve um critério bem delimitado de que esses municípios seriam mapeados como não tendo diário online.
Considerando esses argumentos, a tendência até aqui foi de sistematizar os critérios de validação já existentes (tarefa já prevista e necessária para o relatório e para facilitar o trabalho de futuras validadoras) e fazer apenas checagens pontuais na base (de consistência dos formatos de publicação para um mesmo domínio; e a revalidação dos municípios classificados como sem diário oficial). Não haveria uma revalidação ampla dos mais de 500 municípios já mapeados.
Por hora, **esta questão continua aberta até que possamos discutir o assunto com mais pessoas presentes e ouvir os argumentos de quem é favorável à revalidação ampla**.
## Censo: esforço contínuo ou anual?
O Bernardo propôs uma decisão estratégica sobre o Censo ser um esforço contínuo - ao menos, no sentido de que retornaremos a mirar no mapeamento das cidades acima de 50 mil habitantes assim que terminarmos de consolidar o relatório para as cidades acima de 100 mil.
Outra opção sugerida seria definir o Censo como um esforço anual, de modo que poderíamos voltar à fase de coleta de dados apenas ao redor de outubro de 2021. O formulário do censo permaneceria aberto para receber contribuições enquanto isso, mas não faríamos nenhum esforço de comunicação e engajamento até lá.
A Ana e o Giulio pontuaram que não deveríamos esperar ter energia e recursos para manter uma edição anual do Censo - sobretudo se isso significar incorporar novos aspectos metodológicos e, portanto, revisitar todas as cidades já mapeadas em anos anteriores.
Assim, deveríamos nos concentrar na meta de mapear as cidades acima de 50 mil habitantes assim que pudermos. Em seguida, podemos reavaliar a prioridade das próximas metas, em comparação com outras demandas do projeto e com a atenção que as primeiras rodadas do Censo receberam na sociedade.
## Criar guia de validação
A Ana mencionou que as pessoas que participam da validação deveriam ter um lugar com instruções objetivas e claras dos procedimentos a seguir para revisar um mapeamento de Diário Oficial. Também deveriam ter uma referência dos critérios a adotar em casos que comumente geram dúvidas.
Isso poderia ser feito como uma seção no atual arquivo CONTRIBUTING.md, ou, mais provavelmente, em um documento separado, linkado no CONTRIBUTING.md principal e nos demais locais relevantes (painel de administração, site do censo, relatório etc.). Essa seção/documento também seria uma referência inicial para a seção de metodologia de validação do relatório.
Começou a ser discutido, mas não ficou totalmente claro o quanto esse documento deve servir só para a validação, em senso estrito (checagem dos mapeamentos enviados), ou se também deve incluir a parte de análise.
Foi criada [uma issue](https://github.com/okfn-brasil/censo-querido-diario/issues/43) no repositório do GitHub para acompanhar a criação desse documento.
## Próxima reunião
:::warning
**ATENÇÃO!**
A próxima reunião do censo ocorrerá no dia **29/12/2020, terça-feira**, especialmente por causa do calendário de final de ano. Como sempre, às 19h, no Discord.
:::
###### tags: `Census` `2020` `minutes` `pt`