Странный хакатон №5
В прошедшую субботу мы снова собирались в Технопарке Морион на «Странный хакатон» №5, продолжали улучшать автоматизацию процесса подготовки дайджестов FOSS News.
Итоги:
- Сделан шаблон для Telegram Instant View и скрипт генерации ссылки.
- Доработаны скрипты дампа записей дайджестов и сделан скрипт дампа источников для использования в подготовке данных для ML.
- Сделан скрипт экспорта таблица записей для ручной разметки и заполнения списка ключевых слов.
- Написан скрипт для парсинга текстов, пока из трёх источников.
- Сделана пробная попытка использования TF-IDF для категоризации записей «без учителя», опыт показал что для этого подхода требуется значительная подготовительная работа.
- Новый участник хакатонов разбирался с кодом Telegram бота и начал писать функцию добавления предлагаемых новостей.
Ещё наш новый участник (ушёл раньше, поэтому на фото только постоянные участники) подарил остальным классных динозавриков, собранных из деталей напечатанных на 3D принтере. Модель кстати вот — https://github.com/DrLex0/print3D-FlexiRex