TopicNet
TopicNet copied to clipboard
TopDocumentViewer
issue создан для того, чтобы обсудить возможность создания вьюера, где можно посмотреть как линкуются между собой документы и ключевые слова темы. На данном этапе есть два отдельных вьюера. TopDocumrntViewer которые выводит техническое название топика (которое в 99.(9)% случаев использования этого вьюера является его айдишкой) и примеры документов к этому топику. То есть по факту тексты линкуются к какому-то мало что говоряющему id. и TopTokensViewer который выводит опять этот айди и ключевые слова этого айди.
На практике, когда я анализирую уровень адекватности модели "в ручную", я, конечно, вывожу примеры текстов для каждого топика и прохожусь глазами по тексту. Topic_id не является характеристикой темы, поэтому я не могу оценить адекватность построенной модели с помощью этого вьюера. Характеристикой темы является набор ключевых слов для неё. Это то, что хочется видеть рядом со списком выведенных документов
Отсутствие такой возможности не позволило мне окончательно перейти со своих рукописных фреймворков на TopicNet.
Привет, пересматриваю issue и вспомнил про это предложение. Я правильно понимаю, что если мы дадим возможность пользователям составить словарь { 'Тема_1' : 'Муми-Тролли', 'Тема_2': 'Гуливер', ...} во все вьюверы то это закроет проблему. Т.е. после просмотра топ токенов пользователь сможет "разметить" темы модели и потом использовать уже информативные айди а не сгенерированные?