Градиентные потоки Вассерштайна являются мощным средством, помогающим понять и решить некоторые диффузионные уравнения. В частности, уравнение Фоккера-Планка, которое описывает достаточно широкий класс диффузионных процессов, можно представить как градиентный спуск, минимизирующий энтропийный функционал в пространстве вероятностных мер с метрикой Вассерштайна. В пионерской работе Jordan, Kinderlehrer и Otto была предложена так называемая JKO схема для аппроксимации диффузионных процессов с помощью неявной временной дискретизации градиентного потока в пространстве Вассер- штайна. Вместе с тем, задачи оптимизации, возникающие на каждом шаге JKO схемы, вычислительно трудозатратны. В настоящей работе предложен масштабируемый метод аппроксимации градиентных потоков Вассерштайна, который можно применять в приложениях машинного обучения. Для параметризации JKO шагов используются выпуклые нейронные сети (ICNNs), оптимизируемые с помощью стохастического градиентного спуска. В отличие от предшествующих работ, предложенный подход не требует дискретизации пространства и симуляции частиц. Описан алгоритм создания выборки из распределения градиентного потока в каждый момент времени и метод вычисления функции плотности этого распределения. В качестве вычислительного экспериментов было произведено моделирование некоторых диффузионных процессов, подчиняющихся уравнению Фоккера-Планка а также были решены практические задачи, связанные с семплированием из ненормируемой плотности и нелинейной фильтрацией.
Ключевые слова: оптимальный транспорт, уравнение Фоккера-Планка, градиентные потоки Вассерштайна
Автор: Мокров Петр
Научный руководитель: д.ф.-м.н. Евгений Владимирович Бурнаев