Fundación Naturgy / Empleos que demandará el sector energético
70 Empleos que demandará el sector energético: nuevas oportunidades sostenibles Figura 3.1 Tratamiento de la información Sitios web Scraping Fuente: Elaboración propia. Datos Dado que la mayoría de las ofertas contienen las variables de interés dentro del cuerpo del texto, se requirió un paso posterior para su extracción. Es interesante resaltar la complejidad del proceso de extracción de datos debido la heterogeneidad que presentan los textos de las ofertas de empleo. No únicamente en la estructura de información proporcionada sino también en la longitud de los mismo, dificultando aún más el proceso de creación de la base de datos. De hecho, el número medio de palabas incluidas en la redacción del puesto vacantes es de 523,2 palabras, existiendo también empresas que superan las 2.000 palabras, mientras que otras únicamente con 100 palabras tienen suficiente. Las principales variables utilizadas en este estudio se resumen en la Figura 3.2 A su vez, estas han sido agrupadas en las siguientes categorías: información general, ubicación del lugar de trabajo, experiencia previa requerida, habilidades duras ( hard skills: nivel formativo, idiomas, habilidades técnicas de software específico) y habilidades blandas ( soft skills: sociales y no técnicas). Una vez concluido el proceso de recogida, extracción y procesamiento de datos mediante la técnica de web scraping se ha implementado un proceso de verificación de los datos para garantizar la fiabilidad de la construcción de la base de datos final. De esta manera, los datos adquieren relevancia al pasar de una amplia dispersión en la web a formatos homogeneizados para usos posteriores.
Made with FlippingBook
RkJQdWJsaXNoZXIy OTM0Nw==