python.cz
python.cz copied to clipboard
Kontrola nefunkčních odkazů
Do CI bychom mohli vrazit kontrolu, jestli nám nějaký odkaz na stránce neháže 404. Třeba v seznamu materiálů pro začátečníky je hodně odkazů a třeba už jsou některé mrtvé, ale nikdo to neví. Jsou na to většinou nějaké knihovny, na firemním blogu a dokumentaci máme nějaký Ruby balíček, který to dělá za nás. Nevím, jestli je něco i pro Python.
Nebylo by systematictejsi napsat poradne testy?
@PyDeq: Testy na 404ky u externích odkazů? Jak by se to dělalo?
@honzajavorek: Pro Python asi něco existuje. A já mám něco co chci časem dát do Elsy. Je to primárně na interní odkazy u statických stránek, ale tady to pak asi půjde použít taky. Trochu problém u externích odkazů je že nechceš aby ti 404ka blokovala deployment – mělo by to jen nějak otravovat.
BTW, momentálně situace není hrozná:
Not found: http://localhost/static/images/learning-python-web.svg
Got HTTP status 404 when accessing http://www.investaukce.cz/
[SSL: CERTIFICATE_VERIFY_FAILED]: https://pexe.so/
[SSL: CERTIFICATE_VERIFY_FAILED]: https://www.vaultier.org/
Ručně psané testy na odkazy versus nástroj, který se dá do CI a dělá to za mě mi přijde NIH versus hotové řešení :) Ano, u externích odkazů to pak blokuje deployment i nesouvisejících věcí, to je trochu otrava. My to ve firmě trpíme, vždy to aspoň upozorní a hned to opravíme, ale samozřejmě to není úplně čisté. Je otázka, jestli to není dostačující (good enough).
Startup Idea by byl nástroj, který to hlídá cronem a pošle PR nebo založí issue, když se rozbitý odkaz objeví. A určitě takový SaaS i existuje, možná přímo nějaké Google Web Dev tools, Content King nebo co já vím, nezkoumal jsem to :) Ale přijde mi to kanón na vrabce.
@encukou: @PyDeq: Testy na 404ky u externích odkazů? Jak by se to dělalo?
Třeba jen přes urllib a následně zjištění kódu. Skript se spustí přes Cron a výsledky se uloží do logu, pošlou mailem, ....
Jak myslite...
Toto by se mělo udělat i pro odkazy z JSONů apod., viz https://github.com/pyvec/python.cz/pull/248