querido-diario
querido-diario copied to clipboard
[Novo spider base]: BR Transparência
AO ABRIR uma Pull Request de um novo raspador (spider), marque com um X
cada um dos items da checklist abaixo. Caso algum item não seja marcado, JUSTIFIQUE o motivo.
Layout do site publicador de diários oficiais
Marque apenas um dos itens a seguir:
- [x] O layout não se parece com nenhum caso da lista de layouts padrão
- [x] É um layout padrão e esta PR adiciona a spider base do padrão ao projeto junto com alguns municípios que fazem parte do padrão.
- [x] É um layout padrão e todos os municípios adicionados usam a classe de spider base adequada para o padrão.
Código da(s) spider(s)
- [x] O(s) raspador(es) adicionado(s) tem os atributos de classe exigidos.
- [x] O(s) raspador(es) adicionado(s) cria(m) objetos do tipo Gazette coletando todos os metadados necessários.
- [x] O atributo de classe start_date foi preenchido com a data da edição de diário oficial mais antiga disponível no site.
- [x] Explicitar o atributo de classe end_date não se fez necessário.
- [x] Não utilizo
custom_settings
em meu raspador.
Testes
- [x] Uma coleta-teste da última edição foi feita. O arquivo de
.log
deste teste está anexado na PR. - [x] Uma coleta-teste por intervalo arbitrário foi feita. Os arquivos de
.log
e.csv
deste teste estão anexados na PR. - [x] Uma coleta-teste completa foi feita. Os arquivos de
.log
e.csv
deste teste estão anexados na PR.
Verificações
- [x] Eu experimentei abrir alguns arquivos de diários oficiais coletados pelo meu raspador e verifiquei eles conforme a documentação não encontrando problemas.
- [x] Eu verifiquei os arquivos
.csv
gerados pela minha coleta conforme a documentação não encontrando problemas. - [x] Eu verifiquei os arquivos de
.log
gerados pela minha coleta conforme a documentação não encontrando problemas.
Descrição
Foi criado um Spider baseado no modelo replicável.
Testes
ba_saude_today.csv ba_rio_real_2023-01-01_2023-03-01.csv
ba_saude_today.log ba_rio_real_all.log ba_rio_real_2023-01-01_2023-03-01.log