ig_repertoire_constructor icon indicating copy to clipboard operation
ig_repertoire_constructor copied to clipboard

Hogc

Open eodus opened this issue 8 years ago • 1 comments

Вашему вниманию предлагается новая версия графопостроилки. Изменения:

  1. Она быстрее. Примерно раз в 10.
  2. Она использует клевенькое битовое расстояние (спасибо Насте Антоновой) и ускоренный индекс (спасибо Антону за идею)
  3. В качестве бонуса прилагается построилка оверлап-графа. Работает достаточно быстро, в принципе, можно использовать его вместо этапов выравнивания и сжатия. Оверлап-граф даст нам выравнивание ридов друг на друга.
  4. Для случая ридов равной длины (параметр -Toff) используется быстрая реализация (риды разбиваются по группам и так далее)
  5. Появилось API (!!!) есть функция, которая кушает риды и несколько параметров, выдает объект граф. Сам объект довольно сырой и не очень фичастый, если есть идеи, как это сделать лучше (например, у вас есть либимый формат графа...), то я могу переделать.
  6. Тул и стадии переименованы согласно тому, что они делают реально
  7. SW-граф этой тулой не поддерживается! Только Хемминг! SW это отдельная и довольно сложная история (там и индекс сложнее устроен и сам дистанс так просто по битам не разложить)
  8. Выпилен бесполезный и стремно написанный ig_matcher. Старый графконстрактор я пока оставил, если кому-то нужен SW или что-то подобное.

eodus avatar Jul 16 '16 20:07 eodus

@eodus Саш, можешь сформировать отдельный пол-реквест чисто с алгоритмом? Мне сходу не совсем очевидно, на что смотреть. Также на первый взгляд кажется, что очень большие файлы, и некоторые названия вызывают вопросы, например hgc vs hogc.

Chushuhuch avatar Dec 18 '17 16:12 Chushuhuch