Qu’est ce que : Définition des données
Les données viennent du mot latin ‘datum’, et désignent une représentation par des symboles numériques, alphabétiques ou autres de la caractéristique de quelque chose. Par exemple, nous pourrions dire que cette chose, cette entité, est l’heure actuelle, et le point de référence serait quelque chose comme 15:21.
Dans un programme informatique, l’heure ou les données temporelles seraient peut-être contenues dans une variable. Une variable est appelée ainsi parce qu’elle contient des données qui varient. Par exemple, dans un programme, la variable START_TIME peut être égale à 13, ce qui signifie que quelque chose a commencé à 13hs, tandis que la variable END_TIME peut contenir la donnée 17, ce qui signifie que quelque chose s’est terminé à 17hs.
Une donnée n’a alors aucune signification en soi, mais si elle est traitée correctement, elle peut être utilisée pour effectuer des calculs ou prendre des décisions. Il est donc intéressant de faire la différence entre les concepts de ‘données’ et d’information. Les données, comme indiqué ci-dessus, n’ont pas de signification propre, mais lorsqu’elles sont traitées (biologiquement, mécaniquement ou électroniquement), elles aboutissent à une abstraction qui a une signification en soi : l’information. Dans un système vivant, les ‘données’ peuvent être le son émis par une alarme (un simple bruit en soi), le traitement est l’arrivée du son converti en impulsions nerveuses vers le cerveau, et l’information finale est la ‘prudence’, telle qu’interprétée par notre esprit. En radioastronomie, il est souvent nécessaire de disposer d’un moyen très précis de mesurer le temps. C’est pourquoi il existe des logiciels gratuits qui permettent d’obtenir les données fournies par l’horloge atomique d’un satellite en termes d’heure courante et de les réutiliser pour l’analyse des corps célestes (planètes, astéroïdes, etc.) ou même d’autres satellites en fonctionnement ou hors service.
La manière de quantifier l’ampleur d’une donnée (ou de l’information supplémentaire résultant de son traitement) est le système de bits. La plus petite capacité d’information transmissible s’appelle un bit et est généralement représentée par un chiffre binaire (zéro ou un). Ainsi, la question ‘Comprenez-vous cette phrase ?’ ne peut générer qu’une réponse d’un seul bit (‘oui’ ou ‘non’, 1 ou 0). Un octet de 8 bits est appelé octet dans le jargon. A partir de là, en utilisant des puissances de 2, les unités de quantification de l’information sont le kilooctet (KB, 1024 octets), le mégaoctet (MB, 1024 KB ou environ 1 million d’octets), le gigaoctet (environ 1 milliard d’octets) et leurs multiples successifs.
Pour traiter cette grande quantité de données, il faut un système ayant une capacité et une vitesse suffisantes. Les caractéristiques sur lesquelles fonctionne un algorithme de programme sont exprimées en données. Les bases de données, quant à elles, sont des structures de stockage dans un ordinateur, qui permettent d’y accéder par recherche, sont divisées en champs et sont généralement organisées en enregistrements. On peut considérer l’Internet comme une base de données aux proportions énormes.
Les bases de données ont considérablement simplifié le stockage et le traitement de ce contenu. Des premiers programmes commerciaux destinés au grand public aux systèmes professionnels modernes qui permettent des calculs statistiques complexes, les bases de données sont devenues une véritable spécialité au sein des outils de traitement. En conséquence, des problèmes de sécurité sont apparus, qui ont été partiellement résolus par l’extension des lois sur la protection des données (habeas data) sous diverses formes dans le monde. Cependant, la diffusion des données personnelles des citoyens est source de controverses et de débats, notamment en ce qui concerne les limites offertes à la vie privée.
De même, les réseaux sociaux sont reconnus comme de grandes bases de données, un outil en constante évolution qui permet l’échange d’informations en temps réel entre différents individus ou entités. On estime que le réseau social Facebook constitue la plus grande base de données de l’histoire de l’humanité, dépassant en nombre d’octets toutes les bibliothèques de la Terre dans son ensemble.