Proceso de digitalización (A1C13A2D01)

Introducción

En esta sección se van a enumerar los procesos de digitalización más comunes, junto con el tipo de información que se convierte de analógica a digital.

Atención

La digitalización implica la conversión de analógico a digital de documentos, imágenes, audio, video y/o datos de sensores.

VÍDEO

ALMACENAMIENTO Y DIGITALIZACIÓN (NIVEL A2)

e.digitall.org.es/A1C13A2V02

Digitalización de documentos de texto

El proceso de digitalización de textos es la conversión de documentos en papel a un formato digital legible por una computadora. Generalmente, se utiliza un escáner para capturar una imagen del documento original, que luego se procesa mediante un software de reconocimiento óptico de caracteres (OCR) para convertir la imagen en texto digital.

A continuación, se pueden aplicar técnicas de procesamiento de lenguaje natural (NLP) para analizar el texto digital y extraer información relevante, como nombres, fechas o lugares. Esto permite una búsqueda rápida y precisa de palabras clave en el texto digitalizado.

De esta forma, la conversión de documentos en papel a formato digital, permite su almacenamiento, edición y distribución electrónica.

Saber más

El software OCR (Optical Character Recognition) es un programa informático que convierte imágenes de texto en un documento de texto digital. Utiliza tecnología de reconocimiento de patrones para identificar caracteres en imágenes y luego los traduce en texto digital. Se puede obtener más información sobre el software OCR en el sitio web de Abbyy, uno de los principales proveedores de software OCR del mercado.

Saber más

Las técnicas de procesamiento de lenguaje natural (NLP) son una rama de la inteligencia artificial que se enfoca en la interacción entre el lenguaje humano y las computadoras. El NLP utiliza algoritmos y modelos estadísticos para analizar, entender y generar lenguaje humano. Algunas de las técnicas de procesamiento de lenguaje natural incluyen el análisis de sentimientos, la identificación de entidades, la traducción automática y el reconocimiento de voz.

Para obtener más información sobre las técnicas de procesamiento de lenguaje natural, se puede visitar el sitio web de la Asociación para el Procesamiento del Lenguaje Natural.

Digitalización de imágenes

La digitalización de imágenes es el proceso de convertir imágenes en papel o película en una forma digital. El proceso generalmente implica tres etapas:

1 |  Captura de la imagen: la imagen se escanea o fotografía usando un dispositivo de captura de imágenes, como un escáner o una cámara digital.

2 |  Procesamiento de la imagen: la imagen capturada se procesa utilizando software de edición de imágenes para mejorar su calidad y reducir cualquier distorsión o ruido.

3 |  Almacenamiento de la imagen: la imagen digitalizada se guarda en un formato digital, como JPEG, PNG o TIFF, y se almacena en un dispositivo de almacenamiento, como un disco duro o una unidad flash USB.

Digitalización de audio

El proceso de digitalización de un archivo de audio implica convertir una señal de audio analógica en un formato digital que puede ser almacenado y manipulado por una computadora u otro dispositivo digital. Este proceso implica los siguientes pasos:

1 |  Conversión analógica a digital. La señal de audio analógica se convierte en una señal digital utilizando un conversor analógico-digital (ADC).

2 |  Cuantificación. La cuantificación implica asignar un valor numérico a cada muestra de la señal de audio en función de su amplitud. La resolución de la cuantificación se mide en bits y determina la calidad de la grabación.

3 |  Codificación. Los valores digitales obtenidos después de los pasos anteriores se comprimen en un archivo digital que se puede almacenar en una computadora o dispositivo de almacenamiento.

Saber más

El proceso de conversión de señal de audio analógica a digital involucra la medición de la amplitud de la señal de audio en intervalos regulares y la conversión de esta información en una serie de valores digitales. Es lo que se denomina muestreo. La tasa de muestreo se mide en kilohercios (kHz) y determina la calidad de la grabación.

Digitalización de video

Mediante la digitalización de videos se convierte una señal analógica de video en un formato digital que puede ser reproducido, almacenado y manipulado por una computadora u otro dispositivo digital.

El proceso sigue los mismos pasos que en la digitalización de archivos de audio: la conversión de la señal analógica de video a digital mediante un convertidor analógico-digital (ADC) realizándose un muestreo, la cuantificación y la codificación.

Cabe mencionar que el proceso de digitalización de videos puede ser más complejo y variado que el de digitalización de audio debido a la naturaleza visual del video y la variedad de formatos y resoluciones de video disponibles.

Saber más

La tasa de muestreo de la conversión de señal analógica de video a digital se mide en fotogramas por segundo (fps) y determina la calidad de la grabación.

Características de los documentos digitalizados

La digitalización de cualquier tipo de documento va a permitir las siguientes ventajas:

1 |  Facilidad de acceso y distribución. Los documentos digitales pueden ser enviados, compartidos y se puede acceder fácilmente a ellos desde cualquier lugar del mundo, siempre y cuando exista acceso a Internet.

2 |  Capacidad de búsqueda. Los documentos digitales pueden ser indexados, lo que permite encontrar información específica dentro de un documento de manera más eficiente.

3 |  Edición y modificación. Algunos formatos permiten la edición y modificación del documento original.

4 |  Seguridad. Los documentos digitales pueden ser protegidos mediante contraseñas y permisos de acceso.

Atención

La digitalización implica la conversión de analógico a digital de documentos, imágenes, audio, video y/o datos de sensores.

Por otro lado, los documentos generados de este proceso de digitalización van a presentar las siguientes características a tener en cuenta:

1 |  Tamaño del archivo. Se refiere al espacio de almacenamiento que ocupa el archivo en un dispositivo de almacenamiento. El tamaño de los ficheros digitales puede variar según el formato y el contenido del documento. Algunos formatos, como los de texto plano o enriquecido son muy livianos, mientras que otros pueden ser más pesados, especialmente los que contienen audios, videos e imágenes de alta resolución.

Atención

Como norma general, cuanto mayor sea la longitud o extensión del documento, y cuantas más imágenes especialmente de alta resolución y otros elementos de formato avanzado haya, mayor será el tamaño del archivo.

2 |  Compresión. La compresión de archivos se refiere a la reducción del tamaño de un archivo para que ocupe menos espacio de almacenamiento en un disco duro o para que pueda transmitirse más rápidamente a través de una red de comunicaciones.

3 |  Resolución. La resolución de un archivo se refiere a la cantidad de píxeles que contiene una imagen o video, medida en ancho y alto. En otras palabras, es el tamaño de la imagen o video en términos de su detalle y claridad visual. Cuanto mayor sea la resolución de un archivo, más detalles podrá mostrar y, por lo tanto, será de mayor calidad. Sin embargo, un archivo con una mayor resolución también puede ocupar más espacio de almacenamiento y requerir más recursos para su visualización o procesamiento.

4 |  Metadatos. Los metadatos se refieren a la información adicional que se almacena en los archivos, como la fecha de creación, la ubicación geográfica y otra información relevante. Los metadatos facilitan la identificación y búsqueda de archivos.

Atención

Las características de calidad, tamaño, resolución y compresión pueden variar dependiendo del contenido y la configuración utilizada al crear y guardar un documento.

Tipos de formatos de los documentos digitalizados

Como se ha indicado previamente, el formato de archivo se refiere a la estructura y el tipo de archivo utilizado para almacenar la información digitalizada. En esta sección se indicarán los tipos de formatos más frecuentes según la información digitalizada sea texto, imagen o audio. A su vez, se señalarán las características más importantes de estos formatos, en relación a su tamaño, calidad, resolución y capacidad de compresión.

Formatos de documentos de texto

A continuación, se indican los tipos de formatos de texto más frecuentes junto con sus características principales:

  • DOC/DOCX - Formato de Documento de Microsoft Word. Este tipo de documentos suele tener una calidad alta debido a que pueden contener imágenes, gráficos y otros elementos de formato avanzado. El tamaño de archivo variará según dicho contenido y es posible su compresión.

  • PDF - Formato de Documento Portátil. Los archivos PDF también tienen una calidad alta y conservan el formato original del documento, incluyendo fuentes, imágenes y diseños, independientemente del software utilizado para visualizarlos. La resolución de las imágenes incrustadas puede ser alta. Este hecho, así como su capacidad para incluir elementos complejos, hace que su tamaño de archivo pueda ser mayor que en otros formatos. No obstante, puede reducirse mediante su compresión.

  • TXT - Archivo de Texto sin formato. Los archivos TXT no tienen formato, solo contienen texto plano y, por lo tanto, no van a requerir resolución de imagen, y su calidad y tamaño van a ser bajos. Por ello, tampoco van a precisar de compresión.

  • ODT - Formato de Documento Abierto de LibreOffice. Al igual que los DOC, los ODT pueden tener una calidad alta debido a que contienen imágenes, gráficos y otros elementos de formato avanzado. El tamaño de archivo variará según su contenido y es posible su compresión.

  • RTF - Formato de Texto Enriquecido. Los archivos en formato RTF pueden contener varios estilos de texto, como negrita, cursiva y subrayado, lo que permite una calidad media. Son similares a DOC y ODT, pero no permiten macros. Se pueden comprimir.

Formatos de imágenes

Los formatos de archivo comunes para imágenes digitales incluyen JPEG, PNG, TIFF, BMP y GIF, entre otros. Las características de cada formato podrán afectar a la calidad y a la utilidad de la imagen digitalizada en diferentes aplicaciones, como la impresión, la web o la edición 

Saber más

Además de las características de los documentos digitalizados que se han visto previamente, los archivos de imágenes presentan dos características adicionales:

  • Profundidad de color. Número de bits que se utilizan para representar cada píxel de la imagen digitalizada. Un mayor número de bits significa que la imagen puede representar más colores, lo que resulta en una imagen más detallada y precisa.

  • Modo de color. Forma en que se representan los colores en la imagen digitalizada. Los modos de color comunes incluyen RGB (rojo, verde, azul), CMYK (cian, magenta, amarillo, negro) y escala de grises.
  • JPEG (Joint Photographic Experts Group). Se trata de un formato de compresión de imágenes utilizado para fotografías y otras imágenes. Ofrece una buena calidad de imagen y una alta compresión, lo que resulta en archivos de tamaño pequeño. A menudo se utiliza para imágenes que se van a compartir en línea.

  • PNG (Portable Network Graphics). Formato de imagen sin pérdida de calidad que es adecuado para imágenes con áreas transparentes o con colores sólidos. Tiene una calidad de imagen más alta que JPEG, pero los archivos tienden a ser más grandes.

  • GIF (Graphics Interchange Format). Formato de imagen que admite animaciones y es adecuado para imágenes con un número limitado de colores. La calidad de imagen es menor que en JPEG o PNG, pero es un formato útil para gráficos simples y animaciones cortas.

Formatos de audio

Cada tipo de archivo de audio tiene sus propias ventajas y desventajas en términos de calidad, tamaño y compresión.

  • WAV (Waveform Audio File Format). Formato de audio sin comprimir y de alta calidad que se utiliza en aplicaciones profesionales de grabación y producción de audio. Sin embargo, al no poder comprimirse tienden a ser bastante grandes, lo que puede ser un problema si se necesita almacenar grandes cantidades de audio.

  • MP3 (MPEG-1 Audio Layer 3). Formato de audio comprimido que se utiliza ampliamente para la distribución de música en línea. Su calidad es inferior a los archivos WAV, pero su tamaño más reducido al poder comprimirse facilita su almacenamiento y transmisión en línea.

  • AAC (Advanced Audio Coding). Formato de audio comprimido que se utiliza comúnmente en aplicaciones de transmisión de audio y video en línea. Ofrece mejor calidad de audio que el formato MP3 a tasas de bits similares,
    lo que significa que puede obtenerse un archivo más pequeño sin sacrificar demasiada calidad de audio.

  • FLAC (Free Lossless Audio Codec). Formato de audio sin comprimir que ofrece una calidad de audio similar a la de un archivo WAV, pero con un tamaño de archivo significativamente menor.

Atención

Hay que elegir el formato de audio adecuado en función del propósito del archivo de audio y las limitaciones de almacenamiento y ancho de banda disponibles.

Formatos de video

A continuación, se enumeran los tipos de archivos de video más comunes junto con sus características más destacadas.

  • MP4 (MPEG-4 Part 14). Es el formato de video más utilizado al ser compatible con la mayoría de los dispositivos y plataformas. El formato MP4 utiliza una técnica de compresión con pérdida para reducir el tamaño del archivo sin comprometer demasiado la calidad de video. Por ello, se usan principalmente para la transmisión en línea y la visualización en dispositivos móviles.

  • AVI (Audio Video Interleave). Formato desarrollado por Microsoft que ha sido utilizado durante mucho tiempo. Utiliza una técnica de compresión sin pérdida, lo que significa que los archivos de video son de alta calidad, pero también muy grandes.

  • MOV (QuickTime Movie). Formato desarrollado por Apple. Utiliza una técnica de compresión con pérdida similar a la del formato MP4.

  • WMV (Windows Media Video). Formato de compresión con pérdida desarrollado por Microsoft. La calidad de video es inferior a los MP4, pero también su tamaño.

  • FLV (Flash Video). Formato de archivo de video de compresión con pérdida que se utiliza comúnmente para la transmisión de video en línea, al ser compatible con la mayoría de reproductores de este tipo.

Casos prácticos

En esta sección se van a mostrar ejemplos cotidianos en los que se requiere digitalizar documentos. Se detallarán los pasos a seguir, así como los dispositivos y aplicaciones necesarias.

Digitalización de textos e imágenes

Actualmente, cada vez se permite realizar más trámites de forma digital, ahorrándonos desplazamientos y esperas innecesarias en los establecimientos físicos. Eso implica que necesitamos la documentación necesaria para dichos trámites en su versión digital, por ejemplo, el DNI, documentos contratos firmados, etc. La digitalización también permite la preservación de documentación valiosa, como pueden ser títulos, certificados o escrituras de propiedad.

 

Para digitalizar un documento será necesario, un escáner y un ordenador.

 

Al conectar el escáner al ordenador, es habitual que el ordenador reconozca el nuevo dispositivo y permita su manejo con cualquier programa de exploración. En algunos casos, si se requieren opciones más avanzadas, se puede necesitar un software específico.

Los pasos concretos para llevar a cabo el proceso de digitalización son los siguientes:

1 |  Conectar el escáner al ordenador y encenderlo.
2 |  Colocar el documento de texto en el escáner con el lado que contiene el texto hacia abajo.
3 |  Abrir el software de escaneo en el ordenador.
4 |  Seleccionar la opción de escaneo y configurar la resolución y el formato de archivo deseado.
5 |  Hacer clic en el botón de escaneo.
6 |  Guardar el archivo en el ordenador con un nombre descriptivo.
7 |  Revisar el archivo digitalizado para asegurarse de que la calidad y la legibilidad sean aceptables.

Saber más

Resolución de escaneo

Para la visualización de los documentos la resolución no suele ser un problema, siendo normalmente 200 píxeles por pulgada (ppp) suficiente calidad para la mayoría de los casos. En el caso de fotos, 600ppp suele ser suficiente, a no ser que se requiera recortar una parte de la foto o imprimirla en un tamaño mayor que el original.

También pueden darse casos especiales en lo que sea necesaria al menos una resolución óptica de 4.800ppp, como puede ser el escaneo de un sello o de negativos ya que, al imprimirse, necesitamos un tamaño mucho más grande que el original.

No obstante, en muchos casos podemos digitalizar documentos e imágenes sin la necesidad de un escáner.

 

Existen aplicaciones tanto en móviles como en tablets que permiten el escaneo a través del uso de la propia cámara del dispositivo.

 

En general, los pasos para escanear un documento con estas aplicaciones son similares. Después de abrir la aplicación, se debe apuntar la cámara del dispositivo hacia el documento que se desea escanear, ajustar la nitidez y el brillo si es necesario y guardar el documento escaneado en el formato deseado.

Algunas de dichas aplicaciones son:

  • Adobe Scan. Disponible para iOS y Android. Esta aplicación es gratuita y utiliza la tecnología de Adobe para escanear documentos. Los documentos escaneados se guardan en formato PDF.
  • Microsoft Office Lens. Disponible para iOS y Android. Esta aplicación es gratuita y permite escanear documentos y convertirlos en archivos PDF, Word o PowerPoint.
  • CamScanner. Disponible para iOS y Android. Esta aplicación es gratuita y permite escanear documentos y guardarlos en formato PDF o JPEG.

Digitalización de audio y video

Casos en los que se puede necesitar digitalizar un audio o un video es al querer guardar una grabación de una clase, una conferencia, una reunión o un concierto para poder reproducirla y/o compartirla posteriormente.

 

La digitalización de audios y videos requiere de un dispositivo de grabación, como puede ser, un teléfono móvil, una cámara de video o una grabadora de voz.

 

Si posteriormente es necesario transferir el archivo generado puede ser necesario conectarlo a un ordenador.

A continuación, se van a mostrar los pasos a seguir para digitalizar un audio o un video:

1 |  Preparar el dispositivo de grabación. Es necesario asegurarse de que el dispositivo de grabación esté cargado y con suficiente espacio de almacenamiento para la grabación que se desee hacer. Si se va a usar un teléfono móvil, es recomendable colocar el dispositivo en modo avión o silencioso para evitar interrupciones.

2 |  Configurar la grabación. Si es posible, ajustar la calidad de la grabación, principalmente, resolución y formato.

3 |  Realizar la grabación. Iniciar la grabación asegurándose de que el dispositivo de grabación esté bien ubicado y que no haya interferencias de sonido o imagen.

Una vez finalizada la grabación, se puede editar y/o transferir y compartir el contenido si se desea.

Existen aplicaciones que permiten la edición y compartición directamente a través del móvil, o puede ser necesario transferir la grabación al ordenador por medio de un cable USB.

Ejemplos de aplicaciones de edición de audio son Audacity o Audition. Entre las de video destacan VivaVideo, iMovie o FilmoraGo. Y los archivos se pueden compartir a través de correo electrónico, mensajes de texto, redes sociales, etc.

Saber más

Biblioteca Digital Hispánica. e.digitall.org.es/biblioteca-digital-hispanica

XATAKA. Cómo digitalizar, reparar y compartir tus viejas fotos impresas de papel. e.digitall.org.es/digitalizar-fotos

Gobierno de España. Normas Técnicas de Interoperabilidad. Digitalización de documentos. e.digitall.org.es/normas-digitalizacion