BG Beter Geregeld ICT
PDF redactie · 2 min leestijd · 13 noviembre 2025

OCR y redacción: cómo hacer editables los PDF escaneados para su redacción

Un PDF escaneado es una serie de imágenes, no texto. La búsqueda y la redacción no funcionan sin OCR. Aquí te explicamos el flujo de trabajo.

Muchos documentos llegan como PDF escaneado: contratos firmados, archivos antiguos, cartas médicas. El texto es legible para las personas, pero para el software son simples imágenes. El OCR se encarga de convertirlos.

\n\n

La diferencia

\n
    \n
  • PDF de texto: contiene objetos de texto subyacentes. La búsqueda funciona, el copiar y pegar funciona, la redacción funciona.
  • \n
  • PDF de imagen: solo contiene imágenes rasterizadas. La búsqueda no funciona, el texto no es seleccionable. Primero debe pasar por OCR.
  • \n
\n\n

La calidad del OCR varía

\n
    \n
  • Papel bien escaneado (300+ DPI): precisión de caracteres del 98-99 % con OCR moderno (Tesseract 5, Azure Read, Google Vision).
  • \n
  • Mal escaneado / arrugado / copia sucia: 70-90 %. Requiere verificación manual.
  • \n
  • Texto manuscrito: necesita un modelo específico, entre el 60-85 % en escrituras legibles.
  • \n
\n\n

Flujo de trabajo para la redacción con OCR

\n
    \n
  1. Aplicar OCR al PDF (Acrobat lo incluye; Tesseract, de código abierto, también).
  2. \n
  3. Buscar patrones sensibles (número de seguridad social, correo electrónico, teléfono).
  4. \n
  5. Redactar las regiones identificadas.
  6. \n
  7. Exportar como texto más imagen o solo imagen, según el objetivo.
  8. \n
  9. Verificación: vuelve a pasar el resultado por OCR y comprueba que el texto sensible ya no sea localizable.
  10. \n
\n\n

Un error frecuente a tener en cuenta

\n

Si aplicas OCR y luego redactas a nivel de texto, pero exportas el resultado como imagen, es posible que los datos sensibles permanezcan en la capa de texto subyacente. Asegúrate de redactar también esa capa de texto, no solo la parte visual.

\n\n

Véase también: guía completa de redacción, modo de patrones.

Onderwerpen

#redactie #ocr #gescande-pdf

Volledige gids: Redacción de PDF para pymes: la guía completa

Dit artikel is onderdeel van onze uitgebreide PDF redactie-gids. Lees de pillar voor het complete plaatje.

Lees de pillar →