@Article{Mar{\c c}alRusi{\~n}ol2019, author="Mar{\c{c}}al Rusi{\~n}ol", title="Classificaci{\'o} sem{\`a}ntica i visual de documents digitals", year="2019", abstract="Se analizan los sistemas de procesamiento autom{\'a}tico que trabajan sobre documentos digitalizados con el objetivo de describir los contenidos. De esta forma contribuyen a facilitar el acceso, permitir la indizaci{\'o}n autom{\'a}tica y hacer accesibles los documentos a los motores de b{\'u}squeda. El objetivo de estas tecnolog{\'i}as es poder entrenar modelos computacionales que sean capaces de clasificar, agrupar o realizar b{\'u}squedas sobre documentos digitales. As{\'i}, se describen las tareas de clasificaci{\'o}n, agrupamiento y b{\'u}squeda. Cuando utilizamos tecnolog{\'i}as de inteligencia artificial en los sistemas declasificaci{\'o}n esperamos que la herramienta nos devuelva etiquetas sem{\'a}nticas; en sistemas de agrupamiento que nos devuelva documentos agrupados en clusters significativos; y en sistemas de b{\'u}squeda esperamos que dada una consulta, nos devuelva una lista ordenada de documentos en funci{\'o}n de la relevancia. A continuaci{\'o}n se da una visi{\'o}n de conjunto de los m{\'e}todos que nos permiten describir los documentos digitales, tanto de manera visual (cu{\'a}l es su apariencia), como a partir de sus contenidos sem{\'a}nticos (de qu{\'e} hablan). En cuanto a la descripci{\'o}n visual de documentos se aborda el estado de la cuesti{\'o}n de las representaciones num{\'e}ricas de documentos digitalizadostanto por m{\'e}todos cl{\'a}sicos como por m{\'e}todos basados en el aprendizaje profundo (deep learning). Respecto de la descripci{\'o}n sem{\'a}ntica de los contenidos se analizan t{\'e}cnicas como el reconocimiento {\'o}ptico de caracteres (OCR); el c{\'a}lculo de estad{\'i}sticas b{\'a}sicas sobre la aparici{\'o}n de las diferentes palabras en un texto (bag-of-words model); y los m{\'e}todos basados en aprendizaje profundo como el m{\'e}todo word2vec, basado en una red neuronal que, dadas unas cuantas palabras de un texto, debe predecir cu{\'a}l ser{\'a} lasiguiente palabra. Desde el campo de las ingenier{\'i}as se est{\'a}n transfiriendo conocimientos que se han integrado en productos o servicios en los {\'a}mbitos de la archiv{\'i}stica, la biblioteconom{\'i}a, la documentaci{\'o}n y las plataformas de gran consumo, sin embargo los algoritmos deben ser lo suficientemente eficientes no s{\'o}lo para el reconocimiento y transcripci{\'o}n literal sino tambi{\'e}n para la capacidad de interpretaci{\'o}n de los contenidos.", optnote="DAG; 600.084; 600.135; 600.121; 600.129", optnote="exported from refbase (http://refbase.cvc.uab.es/show.php?record=3282), last updated on Fri, 26 Feb 2021 13:51:12 +0100", opturl="https://www.raco.cat/index.php/Item/article/view/353618/444614" }