Научный руководитель: Воронцов Константин Вячеславович
Научный консультант: Потапова Полина
Научный консультант: Потапова Полина
В данной статье рассматривается задача кроссязычного поиска текстового плагиата. Современные методы векторизации документов и последующего поиска совпадений преимущественно основываются на одном языке, что приводит к возникновению проблемы возникновения однообразных мультиязыковых коллекций документов.
Целью работы является получение модели, кодирующей информацию о распределение слов в тексте независимо от их языковой принадлежности, при этом ограниченной по размеру и времени обучения для ее практического использования.