querido-diario icon indicating copy to clipboard operation
querido-diario copied to clipboard

[Novo spider base]: BR Transparência

Open talesmota opened this issue 8 months ago • 2 comments

AO ABRIR uma Pull Request de um novo raspador (spider), marque com um X cada um dos items da checklist abaixo. Caso algum item não seja marcado, JUSTIFIQUE o motivo.

Layout do site publicador de diários oficiais

Marque apenas um dos itens a seguir:

  • [x] O layout não se parece com nenhum caso da lista de layouts padrão
  • [x] É um layout padrão e esta PR adiciona a spider base do padrão ao projeto junto com alguns municípios que fazem parte do padrão.
  • [x] É um layout padrão e todos os municípios adicionados usam a classe de spider base adequada para o padrão.

Código da(s) spider(s)

  • [x] O(s) raspador(es) adicionado(s) tem os atributos de classe exigidos.
  • [x] O(s) raspador(es) adicionado(s) cria(m) objetos do tipo Gazette coletando todos os metadados necessários.
  • [x] O atributo de classe start_date foi preenchido com a data da edição de diário oficial mais antiga disponível no site.
  • [x] Explicitar o atributo de classe end_date não se fez necessário.
  • [x] Não utilizo custom_settings em meu raspador.

Testes

  • [x] Uma coleta-teste da última edição foi feita. O arquivo de .log deste teste está anexado na PR.
  • [x] Uma coleta-teste por intervalo arbitrário foi feita. Os arquivos de .loge .csv deste teste estão anexados na PR.
  • [x] Uma coleta-teste completa foi feita. Os arquivos de .log e .csv deste teste estão anexados na PR.

Verificações

  • [x] Eu experimentei abrir alguns arquivos de diários oficiais coletados pelo meu raspador e verifiquei eles conforme a documentação não encontrando problemas.
  • [x] Eu verifiquei os arquivos .csv gerados pela minha coleta conforme a documentação não encontrando problemas.
  • [x] Eu verifiquei os arquivos de .log gerados pela minha coleta conforme a documentação não encontrando problemas.

Descrição

Foi criado um Spider baseado no modelo replicável.

Issue relacionada

Testes

ba_saude_today.csv ba_rio_real_2023-01-01_2023-03-01.csv

ba_saude_today.log ba_rio_real_all.log ba_rio_real_2023-01-01_2023-03-01.log

talesmota avatar Jun 10 '24 18:06 talesmota