Emanuele Vivoli, Ali Furkan Biten, Andres Mafla, Dimosthenis Karatzas, & Lluis Gomez. (2022). MUST-VQA: MUltilingual Scene-text VQA. In _Proceedings European Conference on Computer Vision Workshops_ (Vol. 13804, pp. 345–358). LNCS.