La numérisation est le processus de conversion de l’information en un format numérique . Dans ce format, les informations sont organisées en unités discrètes de données (appelées bit s) qui peuvent être adressées séparément (généralement dans des groupes de bits multiples appelés octet s). Il s’agit des données binaires que les ordinateurs et de nombreux appareils dotés d’une capacité de calcul (tels que les appareils photo numériques et les aides auditives numériques) peuvent traiter.,
le texte et les images peuvent être numérisés de la même manière: un scanner capture une image (qui peut être une image de texte) et la convertit en un fichier image, tel qu’un bitmap . Un programme de Reconnaissance optique de caractères (OCR ) analyse une image de texte pour les zones claires et sombres afin d’identifier chaque lettre alphabétique ou chiffre numérique, et convertit chaque caractère en un code ASCII.,
la numérisation Audio et vidéo utilise l’un des nombreux processus de conversion analogique-numérique dans lequel un signal ( analogique ) variable en continu est changé, sans altérer son contenu essentiel, en un signal (numérique) à plusieurs niveaux. Le processus d’échantillonnage mesure l’amplitude (force du signal) d’une forme d’onde analogique à des marqueurs de temps uniformément espacés et représente les échantillons sous forme de valeurs numériques pour l’entrée sous forme de données numériques.
la numérisation des informations facilite leur conservation, leur accès et leur partage., Par exemple, un document historique original peut être accessible uniquement aux personnes qui visitent son emplacement physique, mais si le contenu du document est numérisé, il peut être mis à la disposition des personnes du monde entier. Il y a une tendance croissante à la numérisation des données historiquement et culturellement significatives.
selon un article paru dans The Guardian en mars 2007, si toute la langue parlée depuis la nuit des temps était numérisée, elle consommerait cinq exaoctets d’espace de stockage. L’information numérique totale, en 2006 a été estimée à 161 milliards d’exaoctets. Le courrier électronique à lui seul représentait six exaoctets de ce chiffre.