ig_repertoire_constructor
ig_repertoire_constructor copied to clipboard
Hogc
Вашему вниманию предлагается новая версия графопостроилки. Изменения:
- Она быстрее. Примерно раз в 10.
- Она использует клевенькое битовое расстояние (спасибо Насте Антоновой) и ускоренный индекс (спасибо Антону за идею)
- В качестве бонуса прилагается построилка оверлап-графа. Работает достаточно быстро, в принципе, можно использовать его вместо этапов выравнивания и сжатия. Оверлап-граф даст нам выравнивание ридов друг на друга.
- Для случая ридов равной длины (параметр -Toff) используется быстрая реализация (риды разбиваются по группам и так далее)
- Появилось API (!!!) есть функция, которая кушает риды и несколько параметров, выдает объект граф. Сам объект довольно сырой и не очень фичастый, если есть идеи, как это сделать лучше (например, у вас есть либимый формат графа...), то я могу переделать.
- Тул и стадии переименованы согласно тому, что они делают реально
- SW-граф этой тулой не поддерживается! Только Хемминг! SW это отдельная и довольно сложная история (там и индекс сложнее устроен и сам дистанс так просто по битам не разложить)
- Выпилен бесполезный и стремно написанный ig_matcher. Старый графконстрактор я пока оставил, если кому-то нужен SW или что-то подобное.
@eodus Саш, можешь сформировать отдельный пол-реквест чисто с алгоритмом? Мне сходу не совсем очевидно, на что смотреть. Также на первый взгляд кажется, что очень большие файлы, и некоторые названия вызывают вопросы, например hgc vs hogc.