Resumen:
Cucumber (Cucumis sativus L.) is a globally consumed vegetable and is highly valued
in the food industry. However, its quality largely depends on its physicochemical
properties, such as texture, soluble solids, pH, and acidity, which are gradually affected
by internal and external factors, including temperature, humidity, and storage time.
This study aims to predict the physicochemical changes in cucumber (Cucumis sativus
L.) through the application of machine learning. The methodology involved
physicochemical analyses of the vegetable and image capture for maturity
determination. The study was conducted using Google Colab with Python, leveraging
specialized libraries such as TensorFlow and Keras, along with complementary tools
from scikit-learn and Matplotlib. Deep neural networks with convolutional layers were
implemented for feature extraction, incorporating pooling techniques to reduce image
dimensions. The model was trained over 30 epochs, with hyperparameter tuning to
optimize accuracy. Model performance evaluation was conducted using a confusion
matrix, enabling the determination of the effectiveness of the algorithm in classifying
the maturity index (IM, M).
To statistically validate the results of the chemical properties, a T-student test was
applied for independent samples with a significance level of α = 0.05, establishing a
cutoff point based on a pH value of 4.68. The findings demonstrate the feasibility of
using machine learning to monitor cucumber quality, providing a data-driven approach
for optimizing post-harvest management.
Descripción:
El pepino (Cucumis Sativus L.) es una hortaliza que se consume a nivel global, por
ende, es altamente valorada en el sector alimentario. Empero, la calidad depende, en su
mayoría, por sus propiedades físico-químicas, tales como textura, sólidos solubles, pH y
acidez, quienes gradualmente se ven afectadas por factores internos y externos como la
temperatura, humedad y tiempo de almacenamiento.
El objetivo de esta presente investigación es la predicción de los cambios
fisicoquímicos del pepino (Cucumis Sativus L.) mediante la aplicación del aprendizaje
automático (machine learning), cuyo método es los análisis fisicoquímicos de la
hortaliza y la captura de imágenes para la determinación de la madurez. Por ende, se
desarrolló a cabo en Google Colab utilizando Python, con el soporte de bibliotecas
especializadas como TensorFlow y Keras, así como herramientas complementarias de
scikit-learn y Matplotlib, en donde se emplearon redes neuronales profundas con capas
convolucionales para la extracción de características, aplicando técnicas de pooling para
la reducción de dimensiones de las imágenes capturadas. Este entrenamiento se ejecutó
con un total de 30 épocas (epochs), ajustando hiperparámetros para optimizar la
precisión del modelo. Posteriormente, la evaluación del rendimiento se realizó mediante
una matriz de confusión, permitiendo determinar la efectividad del algoritmo en la
clasificación del índice de madurez (IM, M).
Para validar estadísticamente los resultados de las propiedades químicas, se aplicó una
prueba de hipótesis (Prueba T-student) para muestras independientes con un nivel de
significancia α = 0,05, estableciendo un punto de corte basado en un pH de 4,68.