La motivación es crear un clasificador para enfermedades de plantas con herramientas de computer vision/ inteligencia artificial. Para entrenar el modelo se utilizará el dataset open source de PlantVillage (https://plantvillage.psu.edu/). PlantVillage es una plataforma, desarrollada en Penn State University que pone a disposición contenido libre sobre la salud de los cultivos. La idea de esta plataforma es democratizar el acceso a la información para la producción de alimentos en zonas carenciadas, principalmente en el continente Africano.
El dataset provisto por PlantVillage consta de 54303 imágenes de hojas sanas y no saludables divididas en 38 categorías por especie y enfermedad. El artículo original puede encontrarse en https://arxiv.org/pdf/1511.08060.pdf, realizado por David. P. Hughes, Marcel Salathe [1].
Distribución del dataset por clase,
Distribución del dataset por tipo de planta,
Un análisis estadístico del dataset puede ser consultado en la siguiente notebook: Notebook
Las pruebas se dividieron en modelos de salida única y de salida doble. Los de salida doble brindan clasificaciones por separado por tipo de planta y por enfermedad de la planta. Una guía completa por los esquemas y modelos utilizados puede ser consultado en la siguiente presentación.
-
Modelo multi output 1 Notebook
-
Modelo multi output 2 Notebook
-
Modelo multi output con ResNet Notebook
-
Otras pruebas pueden encontrarse en la carpeta
Se realizó un análisis de la salida de las distintas capas convolucionales para los modelos multi output. Estas visualizaciones de los filtros se pueden consultar en la siguiente carpeta
Con el fin de ampliar el dataset o de realizar otro tipo de pruebas con más imágenes de plantas se realizó un web-scrapper Notebook
[1] An open access repository of images on plant health to enable the development of mobile disease diagnostics, David. P. Hughes and Marcel Salathe, 2016.