OpenScraper
OpenScraper copied to clipboard
An open source webapp for scraping: towards a public service for webscraping
When exporting data by clicking on "download the set as a .tsv file", the resulting file presents shifted columns when data is not present. See for example in the following...
Crawling/Testing not working with that config.  The xpath doesn't seem to find any element.  Crawler is working when I comment `options_selenium.add_argument('headless') `...
Regarding issue #65, I implemented a chrome headless option which allow to run a contributor while seeing the browser. It may also help debugging.
J'aurais remplacé le lien dans la section 5 de la doc d'install : 5 - create a virtual environment for python 2.7 virtual environment) par le lien suivant : https://python-guide-pt-br.readthedocs.io/fr/latest/dev/virtualenvs.html...
Pour répondre aux [besoins du Carrefour des Innovations Sociales](https://github.com/entrepreneur-interet-general/CIS-front/issues/282), il va être nécessaire de relancer règulièrement (tous les jours ? semaines ? mois ?) les mêmes spiders afin de mettre...
La destruction des identifiants casse les liens côté front-end. Voir https://github.com/entrepreneur-interet-general/CIS-front/issues/144
OpenScraper was develops during the SocialConnect EIG challenge, for the needs of the [Carrefour des Innovations Sociales](http://carrefourdesinnovationssociales.fr/) (CIS). From the point of view of the CIS and from that of...
# Description du problème Cette section ne décrit que ce que j'ai compris du problème. J'invite les lectrice.eur.s à compléter avec ce que je n'ai pas compris Le [Carrefour des...