- Place saved model file in a directory nuget_master/src/nuget-master/src/python-scripts/model/trained_models
- Set "auth" variable personal access tokens (classic). Or you can remove it, but it may lead to GitHub rate limits after a while
- Now, change working directory for ./src/nuget-master and run the project
Nuget.Master.mp4
Модель берёт текстовое описание (проекта/запроса), превращает его в вектор (с помощью BERT), а затем с помощью kNN находит наиболее близкие по смыслу репозитории из датасета. Идея в том, чтобы по текстовому описанию рекомендовать NuGet-зависимости, подходящие под задачи проекта. Сначала идёт сбор/очистка данных (убираем эмоджи, «мусор», приводим к единому формату), потом векторизация (BERT), а далее построение kNN для быстрых рекомендаций по схожести текстовых описаний.