Los científicos sociales que trabajan con materiales que requieren digitalización solo pueden estudiar lo que las máquinas pueden leer. En la práctica, eso significa documentos impresos en escritura latina de archivos bien financiados. En un nuevo documento de trabajo, muestro que los Modelos de Lenguaje Visual utilizados en cero disparos superan a todos los sistemas OCR existentes en todos los guiones evaluados, y propongo un pipeline para implementarlos en nuevas colecciones. Lo aplico a seis colecciones archivísticas que abarcan 1.8 millones de páginas en seis países por menos de $1,900.