Ivan Begtin
Ivan Begtin
## Цель На многих сайтах СМИ и не только авторы ссылаются на контракты на сайте zakupki.gov.ru или Госзатраты. При этом информация о контрактах чаще всего выглядит просто как ссылка. Идея...
## Цель На сайт проекта Госзатраты ежесуточно заходит до 10 тысяч человек. Многие из них приходят по поисковым запросам из основных поисковых систем - Яндекс, Google, Mail.ru и Bing Мы...
## Цель В России более миллиона организаций участвующих в госзаказе в ролях поставщиков и госзаказчиков. У всех крупных организаций есть свои официальные сайты. Одновременно с этим не всем пользователям удобно...
## Цель Гарантировать сохранение и возможность удобного повторного использования открытых данных публикуемых на портале data.gov.ru ## Задача - перенести все имеющиеся данные и их описание с портала data.gov.ru на портал...
## Цель Гарантировать сохранение и возможность удобного повторного использования открытых данных публикуемых на портале data.mos.ru ## Задача - перенести все имеющиеся данные и их описание с портала data.mos.ru на портал...
## Цель Нужен парсер который бы на регулярной основе выгружал бы данные из системы ЕМИСС (fedstat.ru) в хаб открытых данных. ## Задача - перенести все имеющиеся данные и их описание...
## Цель Создать удобный сервис для участников хакатонов и всех разработчиков по работе с историческими данными ## Задача - создать общий набор из разрозненных наборов исторических статистических данных - создать...
На сайте PlainRussian.ru сделать раздел с советами и рекомендациями.
Сейчас алгоритм интерпретируют любую точку как разделитель предложения. Необходимо корректно определять предложения и обрабатывать тексты содержащие "т.д." или "т.к." и другие сокращения содержащие точки.
- Оценка корректности для поисковиков - Жанр - Анализ, типа "Ваш текст на 78% проще и на 20% длиннее , чем 80% аналогичных текстов" - Хороший пример близкого текста: ссылка.