Los científicos sociales que trabajan con materiales que requieren digitalización solo pueden estudiar lo que las máquinas pueden leer. En la práctica, eso significa documentos impresos en alfabeto latino procedentes de archivos bien financiados. En un nuevo documento de trabajo, muestro que los Modelos de Lenguaje Vision usaron zero-shot superan a todos los sistemas OCR existentes en todos los scripts evaluados, y propongo una cadena para desplegarlos en nuevas colecciones. Lo aplico a seis colecciones de archivo que abarcan 1,8 millones de páginas en seis países por menos de 1.900 dólares.