El Plan de Impulso a las Tecnologías del Lenguaje (Plan TL) tiene como objetivo general promover la industria del Procesamiento del Lenguaje Natural (PLN) y la Traducción Automática (TA) en España, especialmente en lengua española y lenguas cooficiales y aprovechar estas novedosas capacidades para mejorar el servicio público. Para lograr sus objetivos, el Plan de Impulso de las Tecnologías del Lenguaje se ha estructurado en varios ejes de actuación.
Uno de estos ejes son los Proyectos Faro que se orientan a la puesta en marcha de nuevos servicios públicos o a mejorar la capacidad y calidad de servicios públicos existentes y de procedimientos de las Administraciones Públicas mediante la aplicación de las tecnologías del lenguaje.
Dentro del marco del Plan TL de la SEAD, se encuentra la Vigilancia Sectorial como uno de los verticales de los Proyectos Faro. En este caso, se pretende mejorar la capacidad y la calidad de servicios públicos en el ámbito de I+D+i. Una de las líneas de actuación del Proyecto Faro de Vigilancia Sectorial es generar conocimiento sobre I+D+i, que incluye entre sus actividades el etiquetado automático de corpus de ese ámbito (i.e. ayudas públicas, publicaciones científicas, patentes, etc.). El resultado es esta herramienta de clasificación automática de corpus del ámbito de I+D+i.
Este clasificador (de artículos científicos, patentes y proyectos presentados en convocatorias españolas y europeas) se ha realizado por el grupo TALN de la Universitat Pompeu Fabra y se basa en la extracción de los términos más representativos de los documentos para realizar posteriormente una clasificación usando KNN. El resultado és un sistema rápido y preciso que permite la acutalización continua de los modelos con la incorporación de nuevos documentos.
