Ro-dou
Ro-dou copied to clipboard
Detecção incorreta de nomes que assinam documentos
O método _is_signature
exclui dos resultados de pesquisa os nomes que aparecem no início do texto de resumo, presumindo que sejam os nomes da autoridade que assina o documento, explorando um bug da plataforma do D.O.U., conforme descrito na docstring.
Entretanto, há casos em que o nome aparece no início do texto de resumo, como nestes exemplos 1, 2 e 3. Ao olhar o documento completo, entretanto, percebe-se que o texto de resumo está incorreto e não existe lá (ex.: a palavra "Extratoria" no resuiltado 3), pois combina partes diferentes do texto em ordem inversa.
Sem mexer no próprio portal do D.O.U., a única solução que consigo ver seria fazer um request adicional no documento completo apenas para verificar se o nome que aparece no início do resumo é ou não é a autoridade que assina o documento, já que não é mais possível determinar isso apenas a partir do texto de resumo.