Nghiên cứu này kế thừa các số liệu đã công bố trên trang https://data.mendeley.com/ datasets/46htwnp833/2 về dữ liệu phổ vùng khả kiến - hồng ngoại gần (Vis-NIR) ở khoảng bước sóng từ 309 nm đến 1149 nm của 11691 quả xoài tại Úc, lấy từ 10 giống xoài, thuộc 2 vùng trồng. Nghiên cứu đã phát triển các mô hình học máy với mã nguồn mở Python như: phân tích thành phần chính (PCA) kết hợp với máy vector hỗ trợ (SVM), cây quyết định (DT), rừng ngẫu nhiên (RF) và mạng thần kinh nhân tạo (ANN); mô hình bình phương tối thiểu từng phần kết hợp với phân tích biệt thức (PLS-DA), cùng với mô hình học sâu mạng thần kinh tích chập 1 chiều (1D-CNN) với các bước tiền xử lý dữ liệu phổ toàn phần bao gồm đạo hàm bậc hai và làm mịn bằng thuật toán Savitzky-Golay, cân bằng dữ liệu thông qua kỹ thuật tạo mẫu tổng hợp mới cho mẫu thiểu số (SMOTE). Kết quả cho thấy sử dụng thêm kĩ thuật tiền xử lý số liệu SMOTE trước khi chạy các mô hình học máy đã làm tăng đáng kể khả năng phân loại. Ngoài ra, mô hình 1D-CNN cho hiệu quả phân loại cao hơn so với các mô hình học máy thông thường với độ chính xác (qua phần trăm số mẫu nhận dạng đúng) của mô hình 1D-CNN trong phân loại độ chín của xoài, giống xoài, và địa điểm trồng lần lượt là 99,40%, 94,35% và 96,92%. Mô hình học sâu 1D-CNN thích hợp cho việc phân loại đối tượng khi có lượng lớn hàng chục nghìn mẫu dựa trên dữ liệu phổ.
phân loại xoài, học máy, học sâu, 1D-CNN, phổ Vis- NIR
[1]. K. A. Shah, M. B. Patel, R.J. Patel, P.K. Parmar, “Mangifera indica (mango),” Phar. Rev. Jan, 4(7), pp. 42-48, 2010.
[2]. M. E. Maldonado-Celis, E. M. Yahia, R. Bedoya, et al., “Chemical composition of mango (Mangifera indica L.) fruit: Nutritional and phytochemical compounds,” Front Plant Sci., 10:450160, 2019.
[3]. V. Bennett, A.K.Inengite, “Comparative Study of the Chemical Composition of Three Mango Stem Bark,” Journal of Diseases and Medicinal Plants, 8(3), pp. 55-60, 2022.
[4]. A. K. Kouassi, T. Alabi, G. Purcaro, C. Blecker, S. Danthine, “Assessment of the Impact of Annual Growing Conditions on the Physicochemical Properties of Mango Kernel Fat,” Horticulturae, 10:814, 2024.
[5]. Tran Van Hau, Nguyen Chi Linh, Nguyen Long, “Determining the harvest time of Hoa Loc mango (mangifera indica l.) in Hoa Hung commune, Cai Be district, Tien Giang province,” CTU Journal of Innovation and Sustainable Development, 37(2), pp.111-119, 2015.
[6]. M. D. K. Vithana, Z. Singh, & S. K. Johnson, “Cold storage temperatures and durations affect the concentrations of lupeol, mangiferin, phenolic acids and other healthpromoting compounds in the pulp and peel of ripe mango fruit,” Postharvest Biology and Technology, 139, pp. 91-98, 2018.
[7]. G. Gizachew, G. Gezahegn, & F. Seifu, “Chemical Composition of Mango (Mangifera Indica L) Fruit as Influence by Postharvest Treatments in Arba Minch, Southern Ethiopia,” IOSR Journal of Environmental Science Toxicology and Food Technology, 10(11), pp.70-77, 2016.
[8]. Nguyen Truong Thịnh, Nguyen Duc Thong, Huynh Thanh Cong, Nguyen Tran Thanh Phong, “Mango classification system based on machine vision and artificial intelligence,” 7th International Conference on Control, Mechatronics and Automation, pp. 475-482, 2019.
[9]. D. G. A. Al-Sanabani, M. I. Solihin, L. P. Pui, W. Astuti, C.K. Ang and L. W. Hong, “Development of non-destructive mango assessment using Handheld Spectroscopy and Machine Learning Regression,” Journal of Physics: Conference Series, pp. 12- 30, 2019.
[10]. S. N. Jha, P. Jaiswal, K. Narsaiah, et al., “Authentication of mango varieties using nearinfrared spectroscopy,” Agricultural Research, vol. 2, pp. 229-235, 2013.
[11]. I. W. Budiastra, & H. K. Punvadaria, “Classification of mango by artificial neural network based on near infrared diffuse reflectance,” IFAC Proceedings, 33(29), pp. 157-161, 2000.
[12]. R. Pronprasit, & J. Natwichai, “Prediction of mango fruit quality from Nir spectroscopy using an ensemble classification,” International Journal of Computer Applications, 83(14), 2013.
[13]. N. T. Anderson, K. B. Walsh, P. P. Subedi and C. H. Hayes, “Achieving robustness across season, location and cultivar for a NIRS model for intact mango fruit dry matter content,” Postharvest Biology and Technology, 168, 2020.
[14]. A. Fernández, S. Garcia, F. Herrera and N. V. Chawla, “SMOTE for learning from imbalanced data: progress and challenges, marking the 15-year anniversary,” Journal of artificial intelligence research, 61, pp. 863-905, 2018.
[15]. R. W. Schafer, “What is a Savitzky-Golay filter?” IEEE Signal processing magazine, 28(4), pp. 111-117, 2011.
[16]. I. Syarif, A. Prugel-Bennett, G. Wills, “SVM parameter optimization using grid search and genetic algorithm to improve classification performance,” Telecommunication Computing Electronics and Control, 14(4), 2016.