Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R

Danny Murillo; Dalys Saavedra

PDF HTML

Número
2017: 4to Congreso Internacional AmITIC 2017, Aplicando nuevas tecnologías

Sección
Artículos

Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial-SinObrasDerivadas 4.0.

Danny Murillo

Universidad Tecnológica de Panamá

http://orcid.org/0000-0003-0297-7213

Dalys Saavedra

Universidad Tecnológica de Panamá

https://orcid.org/0000-0002-6135-6233

Enviado: Jul 25, 2017
Publicado: Jul 25, 2017

Resumen

El objetivo de este artículo es hacer uso de la técnica Web Scraping para extraer datos de Google Scholar a través de diferentes métodos. El Web Scraping es una forma de minería de datos no estructurada, que permite extraer información de páginas web, escanear su código HTML y generar patrones de extracción de datos. El artículo muestra las pruebas realizadas de estos métodos para medir la velocidad de extracción de los datos y buscar la mejor forma de extraer los datos de GS de forma estructurada. El artículo también muestra el análisis y desarrollo de un algoritmo en el lenguaje R, para comparar la velocidad de extracción de los datos y la eficiencia en el formato de salida de los datos.

Palabras clave

Web Scraping, Google Scholar, Minería de datos, Lenguaje R, análisis de datos

Descargas

La descarga de datos todavía no está disponible.

Cómo citar

Murillo, D., & Saavedra, D. (2017). Web Scraping de los Perfiles y Publicaciones de una Afiliación en Google Scholar utilizando Aplicaciones Web e implementando un Algoritmo en R. Memorias De Congresos UTP, 8-15. Recuperado a partir de https://revistas.utp.ac.pa/index.php/memoutp/article/view/1465

##plugins.themes.bootstrap3.article.sidebar##

##plugins.themes.bootstrap3.article.main##

Resumen

Palabras clave

Descargas

##plugins.themes.bootstrap3.article.details##