python.cz icon indicating copy to clipboard operation
python.cz copied to clipboard

Kontrola nefunkčních odkazů

Open honzajavorek opened this issue 7 years ago • 6 comments

Do CI bychom mohli vrazit kontrolu, jestli nám nějaký odkaz na stránce neháže 404. Třeba v seznamu materiálů pro začátečníky je hodně odkazů a třeba už jsou některé mrtvé, ale nikdo to neví. Jsou na to většinou nějaké knihovny, na firemním blogu a dokumentaci máme nějaký Ruby balíček, který to dělá za nás. Nevím, jestli je něco i pro Python.

honzajavorek avatar Mar 02 '17 18:03 honzajavorek

Nebylo by systematictejsi napsat poradne testy?

radekholy24 avatar Mar 02 '17 19:03 radekholy24

@PyDeq: Testy na 404ky u externích odkazů? Jak by se to dělalo?

@honzajavorek: Pro Python asi něco existuje. A já mám něco co chci časem dát do Elsy. Je to primárně na interní odkazy u statických stránek, ale tady to pak asi půjde použít taky. Trochu problém u externích odkazů je že nechceš aby ti 404ka blokovala deployment – mělo by to jen nějak otravovat.

BTW, momentálně situace není hrozná:

Not found: http://localhost/static/images/learning-python-web.svg
Got HTTP status 404 when accessing http://www.investaukce.cz/
[SSL: CERTIFICATE_VERIFY_FAILED]: https://pexe.so/
[SSL: CERTIFICATE_VERIFY_FAILED]: https://www.vaultier.org/

encukou avatar Mar 02 '17 21:03 encukou

Ručně psané testy na odkazy versus nástroj, který se dá do CI a dělá to za mě mi přijde NIH versus hotové řešení :) Ano, u externích odkazů to pak blokuje deployment i nesouvisejících věcí, to je trochu otrava. My to ve firmě trpíme, vždy to aspoň upozorní a hned to opravíme, ale samozřejmě to není úplně čisté. Je otázka, jestli to není dostačující (good enough).

Startup Idea by byl nástroj, který to hlídá cronem a pošle PR nebo založí issue, když se rozbitý odkaz objeví. A určitě takový SaaS i existuje, možná přímo nějaké Google Web Dev tools, Content King nebo co já vím, nezkoumal jsem to :) Ale přijde mi to kanón na vrabce.

honzajavorek avatar Mar 03 '17 14:03 honzajavorek

@encukou: @PyDeq: Testy na 404ky u externích odkazů? Jak by se to dělalo?

Třeba jen přes urllib a následně zjištění kódu. Skript se spustí přes Cron a výsledky se uloží do logu, pošlou mailem, ....

brabitom avatar Mar 03 '17 16:03 brabitom

Jak myslite...

radekholy24 avatar Mar 03 '17 20:03 radekholy24

Toto by se mělo udělat i pro odkazy z JSONů apod., viz https://github.com/pyvec/python.cz/pull/248

honzajavorek avatar Nov 25 '17 11:11 honzajavorek