Mejoras en el Entrenamiento de Esquemas de Detección de Sonrisas Basados en AdaBoost

##plugins.themes.bootstrap3.article.main##

Fernando Merchán
Sebastián Galeano
Héctor Poveda
Enviado: Jun 28, 2016
Publicado: Jun 28, 2016

Resumen

El presente artículo aborda aspectos del entrenamiento de la máquina de aprendizaje AdaBoost con modelos de reconocimiento de objetos basados en características de apariencia tales como: Patrones Binarios Locales (LBP), Histograma de Gradientes Orientados (HOG) y características tipo Haar para la detección de sonrisas. En este contexto realizamos un estudio del impacto de varios parámetros de entrenamiento de los modelos. Proponemos un nuevo enfoque con respecto a la selección de muestras positivas utilizadas en el periodo de aprendizaje. A diferencia de otros trabajos que utilizan como muestras positivas rostros sonrientes completos, proponemos utilizar únicamente la sección del rostro correspondiente a la boca sonriente. Las pruebas realizadas muestran que nuestro enfoque ofrece hasta un 40% de disminución en el tiempo de entrenamiento y hasta un 20% de disminución en el tiempo de detección con respecto al enfoque convencional, conservando una precisión de detección comparable. Además, se estudió la in!uencia de la normalización del tamaño de las imágenes de entrenamiento y prueba en ambos enfoques de entrenamiento. También se estudió el impacto del tamaño de las ventanas de análisis en el rendimiento de los métodos de detección para el caso de entrenamiento usando bocas sonrientes como muestras positivas.

Palabras clave

detección de sonrisas, AdaBoost, características tipo Haar, patrones binarios locales, histogramas de gradientes orientados

Descargas

La descarga de datos todavía no está disponible.

##plugins.themes.bootstrap3.article.details##

Cómo citar
Merchán, F., Galeano, S., & Poveda, H. (2016). Mejoras en el Entrenamiento de Esquemas de Detección de Sonrisas Basados en AdaBoost. I+D Tecnológico, 10(2), 17-30. Recuperado a partir de https://revistas.utp.ac.pa/index.php/id-tecnologico/article/view/21
Biografía del autor/a

Fernando Merchán, Universidad Tecnológica de Panamá

Facultad de Ingeniería Eléctrica

Sebastián Galeano, Universidad Tecnológica de Panamá

Facultad de Ingeniería Eléctrica

Héctor Poveda, Universidad Tecnológica de Panamá

Facultad de Ingeniería Eléctrica

Citas

(1) S. Bodiroza; G. Doisy; V.V. Hafner, "Position-invariant, real-time gesture recognition based on dynamic time warping," Human¬Robot Interaction (HRI), 2013 8th ACM/IEEE International Conference on , vol., no., pp.87,88, 3-6 March 2013.

(2) R. Sato; Y. Takeuchi, "Coordinating tum-taking and talking in multi-party conversations by controlling robas eye-gaze," Robot and Human Interactive Communication, 2014 RO-MAN: The 23rd IEEE International Symposium on , vol., no., pp.280,285, 25¬29 Aug. 2014.

(3) L. Sang-Heon; S. Myoung-Kyu; K. Dong-Ju; K. Byungmin; K. Hyunduk, "Smart TV interaction system using face and hand gesture recognition," Consumer Electronics (ICCE), 2013 IEEE International Conference on , vol., no., pp.173,174, 11-14 Jan. 2013.

(4) Z. Xinshuang; A.M. Naguib; L. Sukhan, "Kinect based calling gesture recognition for taking order service of elderly care robot," Robot and Human Interactive Communication, 2014 RO-MAN: The 23rd IEEE International Symposium on, vol., no., pp.525,530, 25-29 Aug. 2014.

(5) A, Cruz.; B, Bhanu ; N, Thakoor, "Vision and Attention Theory Based Sampling for Continuous Facial Emotion Recognition," Affective Computing, IEEE Transactions on, (aceptado para publicación)

(6) U. Kowalik, T. Aoki, and H. Yasuda, "Broaference—a next generationmultimedia terminal providing direct feedback on audience's satisfaction level," in Proc. IFIP TC13 Int. Conf. Human-Comput. Interact. (INTERACT), 2005, pp. 974-977.

(7) J. Whitehill, G. Littlewort, I. Fasel, M. Bartlett, and J. Movellan, "Towards practical smile detection," IEEE Trans. Pattern Anal. Mach. Intel, vol. 31, no. 11, pp. 2106-2111, Nov. 2009.

(8) Y. Shinohara and N. Otsu, "Facial expression recognition using fisher weight maps," in Proc. IEEE Int. Conf. Autom. Face Gesture Recog., 2004, pp. 499-504.

(9) Y.Tian, "Evaluation of Face Resolution for Expression Analysis" IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops (CVPRW'04), Washington, DC, USA, 2004.

(10) O. Deniz, M. Castrillon, J. Lorenzo, L. Anton, and G. Bueno, "Smile detection for user interfaces," in Proc. Int. Symp. Adv. Vis. Comput., 2008, pp. 602-611.

(11) D. Freire, M. Castrillon, and O. Deniz, "Novel approach for smile detection combining LBP and PCA," in Proc. Int. Conf. Comput. Aided Syst. Theory (EUROCAST), 2009.

(12) J. E Cohn and K. L. Schmidt, "The timing of facial motion in posed and spontaneous smiles," Int. J.Wavelets, Multiresolution Inf. Process., vol. 2, pp. 1-12, 2004.

(13) C. Shan,."Smile Detection by Boosting Pixel Differences". IEEE Trans. on Image Processing, Vol. 21, No. 1, January 2012.

(14) W. Pingping; L. Hong; Z. Xuewu, "Spontaneous versus posed smile recognition using discriminative local spatial-temporal descriptors," Acoustics, Speech and Signal Processing (ICASSP), 2014 IEEE International Conference on , vol., no., pp.1240,1244, 4-9 May 2014.

(15) S. Yanjia; A.N. Akansu, "Automatic inference of mental states from spontaneous facial expressions," Acoustics, Speech and Signal Processing (ICASSP), 2014 IEEE International Conference on , vol., no., pp.719,723, 4-9 May 2014.

(16) E Viola and M. Jones, "Rapid object detection using a boosted cascade of simple features," in. Proc. of the 2001 IEEE Conference on Computer Vision and Pattern Recognition , vol.1, 2001, pp.I¬511,1-518.

(17) R. Miyamoto, H. Sugano and H. Saito, "Pedestrian recognition in far-infrared images by combining boosting-based detection and skeleton-based stochastic tracking", in Advances in Image and Video Technology Lecture Notes in Computer Science, Springer Berlin Heidelberg, 2006, 483-494.

(18) R. N. Hota, K. Jonna and P.R. Krishna, "On-road vehide detection by cascade classifiers", in Proceedings of the 3rd Bangalore Annual Compute Conference, Bangalore, India, January 22-23, 2010.

(19) R. Lienhart, J. Maydt, "An extended set of Haar-like features for rapid object detection", in Proc. International Conference on Image Processing, vol.1, 2002, pp.900-903.

(20) L. Zhang, R. Chu, S. Xiang and S. Liao, "Face detection based on Multi-Block LBP representation" , in Advance in Biometrics: Lecture Notes in Computer Science, Springer Berlin Heidelberg, 2007.

(21) N. Dalal and B. Triggs, "Histograms of oriented gradients for human detection", in Proc of the Conf. on Computer Vision and Pattern Recognition, (2005, pp. 886-893.

(22) Y. Ju, H. Zhang and Y. Xue, "Research of Feature Selection and Comparison in AdaBoost based Object Detection System", Journal of Computational Information Systems, pp. 8947-8954, 2013.

(23) M. Minear and D. C. Park,. A lifespan database of adult facial stimuli. Behavior Research Methods, Instruments, & Computers, 36, 630-633, 2004. http://agingmind.utdallas.edu/facedb, The UT Dallas Face Database.UT Dallas Subset.