Posgrados Ingenieria

El uso de LLMS en el campo del procesamiento de archivos. El caso de PWC

04.04.2024

Autor: Posgrados Ingeniería

La empresa PwC se encuentra llevando adelante un proyecto de procesamiento de archivos basado en Large Language Models (LLMS). Debido a la gran cantidad de CVs que reciben a diario ante las búsquedas laborales que se encuentran abiertas, han encontrado la solución para procesar rápidamente los datos de los perfiles que se postulan. 

En el webinar “El uso de las LLMS en el campo del procesamiento de archivos”, organizado por la Facultad de Ingeniería, Ezequiel Castaño, Franco Masuelli y Nicolás Intelángelo, desarrolladores de Phyton, compartieron el detrás de escena de la tecnología que implementaron en PwC. Explicaron cómo aplicar las LLMS como herramienta para el procesamiento y automatización de datos y contaron a los asistentes cómo aplicaron FullStack usando Inteligencia Artificial 

HCCopilot, el sistema que desarrollaron internamente, permite cargar los archivos y luego filtrar la información dentro de los CVs. El filtro no es solo por palabra, sino también, por palabras relacionadas. 

Otra ventaja de esta tecnología es el ranking que genera: puntúa a los candidatos postulantes y los ordena en una lista, de acuerdo con la compatibilidad que tengan con la búsqueda. En el ranking cada persona figura con los componentes principales de su CV, una bio y las skills. 

HCCopilot optimiza el trabajo del sector de recursos humanos, ya que ayuda a filtrar rápidamente, lo que hace de este proceso, una tarea mucho más ágil. El uso de esta tecnología, si bien mejora la experiencia del usuario, no la reemplaza. El rol de quienes trabajan en el sector de búsquedas laborales fue fundamental para el desarrollo de la herramienta.  

¿Qué ventajas les aportó?

  • Reducción del tiempo de procesamiento 
  • Garantía de seguridad de datos 
  • Plantillas definidas y reutilizables 

 

¿Cómo lo hicieron?

LangChain es una tecnología que les permite someter todos los sistemas a un sistema base, para que, independientemente del modelo que se use, el procesamiento de datos funcione igual, con solo modificar el código.  

Por otro lado, Streamlit les permite desarrollar un frontend de forma rápida para presentar un boceto del proyecto al cliente interno, en este caso, el sector de recursos humanos. En medio día se puede armar un frontend básico, simple, lo que posibilita llevar a cabo muchas más iteraciones a partir del intercambio entre el sector de desarrollo y el cliente, para llegar al producto final en menor tiempo.  

El flujo de trabajo consiste en:

  1. Armado de la base de datos con los PDF de cada uno de los CVs 
  2. Recorte de los textos en textos de una sola página 
  3. Planteo de preguntas al modelo para que arroje las mejores 10 o 15 respuestas. El modelo arroja una respuesta de cuáles son los mejores CVs 
  4. Se pueden hacer preguntas más específicas para detectar las respuestas dentro del texto de cada uno de los candidatos.  

Te puede interesar

16.01.2025

El área de Ciencia de Datos de la Fac...
Durante el último año, las actividades de transferen...

08.01.2025

Evaluación de proyectos de inteligenc...
El pasado 6 de diciembre concluyó este encuentro, qu...

Compartir