ClickBench
ClickBench copied to clipboard
ClickBench query 29
Running q29 produces results like
http://rihanner.ferio.ru/katalogOrigin 38 149869 http://rihanner.ferio.ru/katalogOrigin
http://irr.ru/jobs-educations/tehnik 36 123637 http://irr.ru/jobs-educations/tehnik
https://google.com/fee=меньше 35 2958167 https://google.com/fee=меньше
http://kirov.irr.ru/index.php%3Ftb 34 273645 http://kirov.irr.ru/index.php%3Ftb
http://video.yandsearch/price=от 34 268732 http://video.yandsearch/price=от
http://irr.ru/jobinmoscow.ru/Nike 33 260592 http://irr.ru/jobinmoscow.ru/Nike
http://bdsmpeople.ru/register2123 33 164925 http://bdsmpeople.ru/register2123
...
I would have expect to see host names return as a result
With Postgres I do receive correct result
postgres=#
postgres=# SELECT REGEXP_REPLACE('http://irr.ru/jobs-educations/tehnik', '^https?://(?:www.)?([^/]+)/.*$', '\1');
regexp_replace
----------------
irr.ru
(1 row)
postgres=# SELECT REGEXP_REPLACE('http://rihanner.ferio.ru/katalogOrigin', '^https?://(?:www.)?([^/]+)/.*$', '\1');
regexp_replace
-------------------
rihanner.ferio.ru
(1 row)
postgres=#
I confirm, it is a bug in ClickHouse.
The bug is fixed and the results are updated.