Results 3 comments of okuhara

> ところでこの件とは関係なく以前から少し思っていたことなのですが GUIバージョンのEgaroucidはclangではコンパイルできないのでしょうか? もしできるのならそれだけで結構速くなりそうな気もしますけど 横からすみません。このバグとは関係ないのですが、edax-AVX は gcc, clang, msvc, icc の比較では clang が一番遅いです。 その原因と思われるのがこの flip の部分で、最適化しようとしてかえって悪くしているような感じでした。 ですのでうまく書き換えると clang のスコアはもう少しよくなるかもしれないと思っていました。 私も acepck さんのコード、参考にさせていただきます。 MSVC で正しく動作しない AVX512 のソース、私も持っています。あまり速くないバージョンだったので、気にしませんでしたが。

@acepck さん コード拝見しました。いくつもの最適化の工夫、まだこれほど改善の余地があったかと感服しました。 edax-AVX にも取り込ませていただくとともに、私の [bitboard の解説ページ](http://www.amy.hi-ho.ne.jp/okuhara/bitboard.htm)にも加えさせていただきたいと思います。 acepck さんをメンションするときにリンクすべき url があれば教えてください。無ければ PR #293 にリンクします。

@acepck さん コンパイルされたコードを見たときはいけそうな気がしたのですが、Haswell で測定すると確かに元のコードの方が速いですね。PCMPGTQ が latency = 5 と劇遅なのが響いているようです。 CPU によっては逆転する可能性はありますが、本線では採用しにくいかもしれません。