querido-diario icon indicating copy to clipboard operation
querido-diario copied to clipboard

[Novo spider]: Guaratuba-PR #1138

Open talesmota opened this issue 9 months ago • 4 comments

Layout do site publicador de diários oficiais

Marque apenas um dos itens a seguir:

Código da(s) spider(s)

  • [x] O(s) raspador(es) adicionado(s) tem os atributos de classe exigidos.
  • [x] O(s) raspador(es) adicionado(s) cria(m) objetos do tipo Gazette coletando todos os metadados necessários.
  • [x] O atributo de classe start_date foi preenchido com a data da edição de diário oficial mais antiga disponível no site.
  • [x] Explicitar o atributo de classe end_date não se fez necessário.
  • [x] Não utilizo custom_settings em meu raspador.

Testes

  • [x] Uma coleta-teste da última edição foi feita. O arquivo de .log deste teste está anexado na PR.
  • [x] Uma coleta-teste por intervalo arbitrário foi feita. Os arquivos de .loge .csv deste teste estão anexados na PR.
  • [x] Uma coleta-teste completa foi feita. Os arquivos de .log e .csv deste teste estão anexados na PR.

Verificações

Descrição

URL da forma de consulta

http://portal.guaratuba.pr.gov.br/diariosoficiais

Período de publicação
  • [x] janeiro/2010 - hoje
  • [x] filtros por datas estão funcionais também
Formato da publicação

Os diários oficiais são publicados em PDF (texto)

Conteúdo da publicação

Diário único: documento publicado é uma edição completa do diário oficial

Detalhes do site de publicação

No response

Observações

No response

Evidências

talesmota avatar May 09 '24 16:05 talesmota