Quelle est la différence entre informations et données ? Concepts d'information donnés par diverses sciences. Différence avec les données d'information et les connaissances

Les données et les informations sont souvent assimilées, mais il existe une différence significative entre les deux termes :

Information- les connaissances relatives aux concepts et objets (faits, événements, choses, processus, idées) dans le cerveau humain ;

Données- présentation d'informations traitées susceptibles d'être transmises, interprétées ou traitées (fichiers informatiques, documents papier, enregistrements dans un système d'information).

La différence entre informations et données est la suivante :

1) les données sont des informations fixes sur des événements et des phénomènes qui sont stockées sur certains supports, et des informations apparaissent à la suite du traitement des données lors de la résolution de problèmes spécifiques.

Par exemple, diverses données sont stockées dans des bases de données et, sur demande spécifique, le système de gestion de base de données fournit les informations requises.

2) les données sont des supports d'informations, pas l'information elle-même.

3) Les données ne se transforment en informations que lorsqu'une personne s'y intéresse. Une personne extrait des informations à partir de données, les évalue, les analyse et, sur la base des résultats de l'analyse, prend une décision ou une autre.

Les données se transforment en informations de plusieurs manières :

Contextualisation : on sait à quoi servent les données ;

Comptage : nous traitons les données mathématiquement ;

Correction : nous corrigeons les erreurs et éliminons les omissions ;

Compression : Nous compressons, concentrons et agrégeons les données.

Ainsi, s’il est possible d’utiliser les données pour réduire l’incertitude des connaissances sur un sujet, alors les données se transforment en informations. Par conséquent, on peut affirmer que l’information est la donnée utilisée.

4) Les informations peuvent être mesurées. La mesure de mesure du contenu de l'information est associée à un changement du degré d'ignorance du destinataire et repose sur les méthodes de la théorie de l'information.

2. Domaine- il s'agit d'une partie du monde réel, dont nous voulons refléter les données dans la base de données. Le domaine est infini et contient à la fois des concepts et des données essentiellement importants, ainsi que des données insignifiantes ou non significatives. Ainsi, l’importance des données dépend du choix du domaine.

Modèle de domaine. Un modèle de domaine est notre connaissance d'un domaine. La connaissance peut prendre la forme d’une connaissance informelle dans le cerveau de l’expert ou être exprimée formellement par certains moyens. L'expérience montre que la manière textuelle de représenter un modèle de domaine est extrêmement inefficace. Les descriptions du domaine réalisées à l'aide de notations graphiques spécialisées sont bien plus informatives et utiles lors du développement de bases de données. Il existe un grand nombre de méthodes pour décrire un domaine. Les plus connues incluent la technique d'analyse structurelle SADT et IDEF0 basée sur celle-ci, les diagrammes de flux de données de Gein-Sarson, la technique d'analyse orientée objet UML, etc. Le modèle de domaine décrit plutôt les processus se produisant dans le domaine et les données utilisées. par ces processus. Le succès du développement ultérieur de l'application dépend de la manière dont le domaine est correctement modélisé.

3. Base de données- un ensemble de matériaux indépendants présentés sous une forme objective (articles, calculs, règlements, décisions de justice et autres matériaux similaires), systématisés de manière à ce que ces matériaux puissent être trouvés et traités à l'aide d'un ordinateur électronique (ordinateur).

De nombreux experts soulignent l'erreur courante consistant à utiliser à tort le terme « base de données » au lieu du terme « système de gestion de base de données », et soulignent la nécessité de distinguer ces concepts.

POINTS DE BASE

1. Dans la vie de tous les jours, les gens utilisent souvent le terme « information », en lui donnant un sens simple : « message ». Lorsqu'ils disent : « Nous n'avons pas assez d'informations », « Je donne des informations ! », « Ceci est une information scientifique », alors intuitivement le terme « information » désigne un éventail de significations assez large : « corpus de connaissances », « données", "concepts", " présentations", "actualités", "informations".

Il n’existe pas encore de formulation scientifique généralement acceptée du terme « information ». Les options proposées souffrent d'incomplétude, souvent de flou et d'imprécision. Dans ce cas, en science, il est d'usage de construire une définition en énumérant et en décrivant les propriétés d'un objet ou d'un phénomène.

Considérons les propriétés fondamentales de l'information. Comme première définition de travail, nous prendrons la plus courante : l'information est toute information (1). Ici, les mots « information » et « information » sont considérés comme synonymes. Cependant, il existe de nombreuses situations dans lesquelles les informations ne fournissent pas d'informations. Ainsi, A.P. Tchekhov dans l'histoire « Professeur de littérature » met dans la bouche du héros, le professeur Ippolit Ippolitovich, une phrase devenue un symbole de banalité communicative : « La Volga se jette dans la mer Caspienne et les chevaux mangent de l'avoine et du foin. » Cette information est vraie, mais elle ne contient aucune information. Un point important pour comprendre l'essence du phénomène étudié : ce message n'est pas porteur d'information, il contient un fait bien connu.

Toutes les informations ne sont pas informatives, mais seulement celles qui contiennent quelque chose d'important, de nouveau et de précieux pour le destinataire. C'est le destinataire du message qui décide s'il considère ou non le message comme informatif. Compte tenu de ce qui précède, nous pouvons clarifier la formulation précédente : l'information est une information qui soit a une signification (valeur) pour le destinataire, soit l'acquiert (2). Précisons quelques positions :

l'information existe dans certaines conditions, elle y est liée, il existe une source d'information, un objet informateur qui peut diffuser certaines informations ;

l'information a une valeur inégale du point de vue des utilisateurs qui la reçoivent ;

le récepteur de l'information effectue une sélection, la divisant en informative et inutile (cette dernière est appelée bruit).

L'information dans la communication humaine a toujours un sens, basée sur l'écart de connaissances entre les locuteurs.

Un spécialiste des relations publiques ou un journaliste doit comprendre que son message ne sera perçu comme informatif que lorsqu'il est pertinent ou présente les faits d'une manière nouvelle et suscite un intérêt significatif.

Il est légitime de parler de la valeur subjective de l'information. Tout le monde ne percevra pas les mêmes informations comme significatives pour eux. Les informations sur le taux de change des monnaies mondiales ont une valeur importante (informative) pour un homme d'affaires, pour le propriétaire d'une monnaie, mais ceux qui ne sont pas impliqués dans les transactions de change les traiteront avec indifférence. Les informations sont fonctionnellement liées aux objectifs du destinataire. Au sens ordinaire, l'arrivée d'un message est associée à certains événements. Ce sont les événements qui sont à l'origine d'un message contenant ou non des informations.

Le processus d'échange d'informations joue un rôle important dans la vie de toute créature. La capacité de transmettre ou de recevoir des informations au sens le plus large est un critère de vie. Un message concernant des changements dans les conditions de l'environnement d'existence est détecté par un organisme vivant comme favorable ou dangereux, nécessitant certaines réactions. La notion d'information est si complète que certains scientifiques l'incluent dans la définition de la vie, par exemple N. Wiener.

L'information est impliquée dans des actes de communication avec le monde extérieur. La communication est une connexion, un échange d'informations.

Ainsi, communication, information, vitalité sont des concepts du même cercle.

Une autre propriété de l'information. Ayant perdu sa nouveauté, l'information disparaît. Nous ne relisons pas l'abécédaire, car tout ce qu'il contient est connu et peu informatif

D’où quelques conclusions préliminaires :

l'information est l'inconnu, l'incertain,

les informations subjectives disparaissent une fois qu'elles sont perçues par l'utilisateur.

L'incertitude et le contenu de l'information sont liés par des relations mathématiques : plus l'incertitude est grande, plus le message est informatif.

Ainsi, l'information a deux propriétés contradictoires :

il s'agit d'une certaine quantité de données qui existent de manière objective, indépendante et mesurable (par exemple, des données dans un ordinateur ; volume, nombre de caractères imprimés dans un livre) ;

La valeur informative et l'utilité de ces données sont déterminées par le fait qu'elles seront compréhensibles pour les gens et pourront élargir et clarifier leurs connaissances. Par conséquent, l’évaluation du « contenu informatif » de données spécifiques est subjective ; cela dépend de la quantité de connaissances d'un individu particulier. C'est un fait que le rapport 2x2 = 4 est une véritable découverte pour un élève de première année, mais au bout d'un moment cette information devient banale pour lui.

Au 20ème siècle Dans le cadre du développement des connaissances scientifiques, la notion d'information s'est considérablement approfondie. L'information a commencé à être considérée comme quelque chose d'indépendant dans le cadre d'une nouvelle science, la cybernétique, qui étudie les processus de gestion. La cybernétique prouve que l'information participe aux processus de contrôle et de développement de tout système (organismes vivants ou dispositifs automatiques) qui assurent la stabilité et la survie. Sur la base des idées cybernétiques originales, les philosophes tentent de justifier largement leurs vues sur les propriétés de l'information en tant que catégorie philosophique. En science philosophique, deux idées directrices ont émergé qui expliquent de différentes manières les propriétés de l'information et ses caractéristiques.

Les adeptes d'une école (B.V. Biryukov, I.B. Novnk, A.D. Ursul et autres) qualifient l'information comme une propriété de tout objet matériel. Selon les adeptes de cette direction (on les appelle parfois attributs de stam et), les informations peuvent être extraites de n'importe quel objet matériel de nature vivante et inanimée. La matière est considérée comme un référentiel d’« informations mortes ». L'information est contenue objectivement, mais dans un Hadès caché. Dans le cadre des objets naturels, il existe toujours une certaine structure (un ensemble de parties, lorsque les connexions entre les parties composantes sont nécessairement prises en compte), qui peut être connue. Par conséquent, ces informations sont dites cachées, structurelles (parfois liées). Seul un observateur, une personne, peut extraire des informations. Il le traite, l'encode et le recode pour transférer l'information d'un objet à un sujet. Ainsi, l'information est une partie de la connaissance utilisée activement et à dessein (3).

Le sens de l'activité réside dans l'interaction directe ou indirecte (par exemple, par contact interpersonnel dans la communication, etc.) avec l'objet de la connaissance. L'information ne devient demandée que s'il existe un être intelligent, un destinataire de l'information, capable de comprendre le contenu du message stocké. Les informations sont mises à jour lorsqu'un sujet conscient et pensant apparaît, affecte les récepteurs de ses sens, provoque des réactions, une prise de décision appropriées et est impliqué dans la gestion du comportement. Ce processus (extraction d'informations) est individuel. Par exemple, un artiste admire une nuance particulière dans la couleur des yeux d’un modèle, et un médecin voit les signes d’une maladie dangereuse dans ces mêmes nuances de couleur des yeux.

Les données sont une collection d'informations enregistrées sur n'importe quel support : papier, disque, film. Ces informations doivent se présenter sous une forme adaptée au stockage, à la transmission et au traitement. Une transformation ultérieure des données permet d'obtenir des informations. Ainsi, l’information peut être considérée comme le résultat de l’analyse et de la transformation des données. La base de données stocke diverses données et le système de contrôle peut fournir les informations requises sur demande spécifique. Par exemple, vous pouvez savoir à partir de la base de données de l'école quels élèves habitent dans une certaine rue ou qui n'ont pas reçu de mauvaise note au cours de l'année, etc. Les données se transforment en informations lorsqu'ils s'y intéressent. On peut affirmer que les informations sont des données utilisées.

Le mot « information » vient du latin informatio, « information, présentation, explication ». L'information est également appelée information sur les objets, les phénomènes environnementaux, leurs propriétés, qui réduisent le degré d'incertitude et de connaissances incomplètes. Grâce à l'échange d'informations, une compréhension plus complète du sujet se forme et le niveau de sensibilisation augmente.

L’information n’existe pas de manière isolée. Il y a toujours une source qui le produit et qui le perçoit. Tout objet agit comme une source ou un récepteur : une personne, un ordinateur, un animal, une plante. Les informations sont toujours destinées à un objet spécifique.

Une personne reçoit des informations de diverses sources - en lisant, en écoutant la radio, en regardant la télévision, lorsqu'elle touche un objet, goûte de la nourriture. Différentes personnes peuvent percevoir différemment la même information.

Selon le domaine d'utilisation, il existe des informations scientifiques, techniques, économiques et autres. C’est le moyen le plus puissant d’influencer la société dans son ensemble. Selon l'expression bien connue, celui qui possède le plus d'informations sur une question donnée possède le monde, c'est-à-dire qu'il se trouve dans une position avantageuse par rapport aux autres. Dans la vie de tous les jours, le développement de la société, la santé et la vie des personnes dépendent de l'information.

Au cours de milliers d’années, l’humanité a accumulé d’énormes connaissances, qui ne cessent de s’accroître. De nos jours, la quantité d’informations double tous les deux ans. Dans toute situation, même la plus banale, seule une information pertinente, complète, fiable et compréhensible est efficace. Seules les informations pertinentes, c'est-à-dire reçues à temps, peuvent profiter aux gens. Il est important de recevoir une prévision météorologique ou une alerte d’ouragan la veille et non le jour même.

5.1. Différences entre connaissances et données

Une caractéristique des systèmes intelligents est la présence des connaissances nécessaires pour résoudre des problèmes dans un domaine spécifique. Cela soulève une question naturelle : qu’est-ce que la connaissance et en quoi diffère-t-elle des données ordinaires traitées par un ordinateur ?

Les données sont des informations de nature factuelle qui décrivent des objets, des processus et des phénomènes du domaine, ainsi que leurs propriétés. Dans les processus de traitement informatique, les données subissent les étapes de transformation suivantes :

La forme initiale d'existence des données (résultats d'observations et de mesures, tableaux, ouvrages de référence, schémas, graphiques, etc.) ;

Présentation dans des langages spéciaux de description de données destinées à la saisie et au traitement des données initiales dans un ordinateur ;

Bases de données sur supports de stockage informatiques.

La connaissance est une catégorie d’informations plus complexe que les données. La connaissance décrit non seulement des faits individuels, mais aussi les relations entre eux, c'est pourquoi la connaissance est parfois appelée données structurées. Les connaissances peuvent être obtenues sur la base du traitement de données empiriques. Ils sont le résultat de l’activité mentale d’une personne visant à généraliser son expérience acquise grâce à une activité pratique.

Afin de fournir des connaissances à IIS, celles-ci doivent être présentées sous une certaine forme. Il existe deux manières principales de transmettre des connaissances aux systèmes logiciels. La première consiste à mettre des connaissances dans un programme écrit dans un langage de programmation classique. Un tel système sera un code de programme unique dans lequel les connaissances ne seront pas placées dans une catégorie distincte. Malgré le fait que le problème principal sera résolu, dans ce cas, il est difficile d'évaluer le rôle des connaissances et de comprendre comment elles sont utilisées dans le processus de résolution de problèmes. Modifier et maintenir de tels programmes n'est pas une tâche facile et le problème de la mise à jour des connaissances peut devenir insoluble.

La deuxième méthode repose sur le concept de bases de données et consiste à placer les connaissances dans une catégorie à part, c'est-à-dire les connaissances sont présentées dans un format spécifique et placées dans la base de connaissances. La base de connaissances est facilement mise à jour et modifiée. Il s'agit d'une partie autonome d'un système intelligent, bien que le mécanisme d'inférence logique mis en œuvre dans le bloc logique, ainsi que les moyens de dialogue, imposent certaines restrictions sur la structure de la base de connaissances et les opérations avec celle-ci. Cette méthode est adoptée dans IIS moderne.

Il est à noter que pour mettre des connaissances dans un ordinateur, celles-ci doivent être représentées par certaines structures de données correspondant à l'environnement choisi pour développer un système intelligent. Par conséquent, lors du développement d'un système d'information, les connaissances sont d'abord accumulées et présentées, et à ce stade la participation humaine est requise, puis les connaissances sont représentées par certaines structures de données faciles à stocker et à traiter dans un ordinateur. Les connaissances dans IIS existent sous les formes suivantes :

Connaissances initiales (règles dérivées de l'expérience pratique, dépendances mathématiques et empiriques reflétant des connexions mutuelles entre les faits ; modèles et tendances décrivant l'évolution des faits au fil du temps ; fonctions, diagrammes, graphiques, etc.) ;

Description des connaissances initiales au moyen du modèle de représentation des connaissances sélectionné (nombreuses formules logiques ou règles de production, réseau sémantique, cadres, etc.) ;

Représentation de connaissances par des structures de données destinées au stockage et au traitement sur un ordinateur ;

Bases de connaissances sur les supports de stockage informatique.

Qu'est-ce que la connaissance ? Donnons quelques définitions.

Extrait du dictionnaire explicatif de S.I. Ozhegov : 1) « La connaissance est la compréhension de la réalité par la conscience, la science » ; 2) « La connaissance est la totalité des informations, des connaissances dans n'importe quel domaine. »

La définition du terme « connaissance » comprend principalement des éléments philosophiques. Par exemple, la connaissance est le résultat testé par la pratique de la connaissance de la réalité, son reflet correct dans l'esprit humain.

La connaissance est le résultat obtenu par la compréhension du monde environnant et de ses objets. Dans les situations les plus simples, la connaissance est considérée comme un énoncé de faits et leur description.

Les chercheurs en IA fournissent des définitions plus spécifiques de la connaissance.

"La connaissance correspond aux lois d'un domaine (principes, liens, lois), obtenues à la suite d'activités pratiques et d'expériences professionnelles, permettant aux spécialistes de poser et de résoudre des problèmes dans ce domaine."

« La connaissance est constituée de données bien structurées, ou de données sur des données, ou de métadonnées. »

« La connaissance est une information formalisée à laquelle on fait référence ou qui est utilisée dans le processus d'inférence logique. »

Dans le domaine des systèmes d'IA et de l'ingénierie des connaissances, la définition de la connaissance est liée à l'inférence logique : la connaissance est une information à partir de laquelle le processus d'inférence logique est mis en œuvre, c'est-à-dire Sur la base de ces informations, diverses conclusions peuvent être tirées des données disponibles dans le système par inférence logique. Le mécanisme d'inférence vous permet de relier des fragments individuels entre eux, puis de tirer une conclusion basée sur cette séquence de fragments liés.

La connaissance est une information formalisée à laquelle on fait référence ou qui est utilisée dans le processus d'inférence logique (Fig. 5.1.).


Riz. 5.1. Processus d'inférence dans les SI

Par connaissance, nous entendons un ensemble de faits et de règles. Le concept de règle représentant une connaissance a la forme :

Si<условие>Que<действие>.

Cette définition est un cas particulier de la définition précédente.

Cependant, il est reconnu que les caractéristiques qualitatives distinctives de la connaissance sont dues à la présence de grandes opportunités dans le sens de la structuration et de l'interconnectivité des unités constitutives, de leur interprétabilité, de la présence de métriques, de l'intégrité fonctionnelle et de l'activité.

Il existe de nombreuses classifications des connaissances. En règle générale, à l'aide de classifications, la connaissance de domaines spécifiques est systématisée. À un niveau de considération abstrait, nous pouvons parler des caractéristiques selon lesquelles les connaissances sont divisées, et non de classifications. De par leur nature, les connaissances peuvent être divisées en connaissances déclaratives et procédurales.

La connaissance déclarative est une description de faits et de phénomènes, enregistre la présence ou l'absence de tels faits et comprend également des descriptions des connexions et des modèles de base dans lesquels ces faits et phénomènes sont inclus.

La connaissance procédurale est une description des actions possibles lors de la manipulation de faits et de phénomènes pour atteindre les objectifs visés.

Pour décrire les connaissances à un niveau abstrait, des langages spéciaux ont été développés - les langages de description des connaissances. Ces langages sont également divisés en langages procéduraux et déclaratifs. Tous les langages de description de connaissances orientés vers l'utilisation des ordinateurs à architecture von Neumann traditionnelle sont des langages procéduraux. Le développement de langages déclaratifs pratiques pour représenter les connaissances est aujourd'hui un problème urgent.

Selon le mode d'acquisition des connaissances, celles-ci peuvent être divisées en faits et heuristiques (règles qui permettent de faire un choix en l'absence de justification théorique précise). La première catégorie de connaissances indique généralement des circonstances bien connues dans un domaine donné. La deuxième catégorie de connaissances repose sur la propre expérience d'un expert travaillant dans un domaine spécifique, accumulée au cours de nombreuses années de pratique.

En fonction du type de représentation, les connaissances sont divisées en faits et en règles. Les faits sont des connaissances du type « A est A », ces connaissances étant typiques des bases de données et des modèles de réseau ; Les règles, ou produits, sont des connaissances du type « SI A, ALORS B ».

En plus des faits et des règles, il existe également des métaconnaissances – des connaissances sur la connaissance. Ils sont nécessaires à la gestion des connaissances et à l’organisation efficace des procédures d’inférence logique.

La forme de représentation des connaissances a un impact significatif sur les caractéristiques des systèmes d'information. Les bases de connaissances sont des modèles de connaissances humaines. Cependant, toutes les connaissances qu'une personne utilise pour résoudre des problèmes complexes ne peuvent pas être modélisées. Par conséquent, dans les systèmes intelligents, il est nécessaire de séparer clairement les connaissances entre celles qui sont destinées à être traitées par un ordinateur et celles utilisées par les humains. Évidemment, pour résoudre des problèmes complexes, la base de connaissances doit avoir un volume suffisamment important, et donc des problèmes de gestion d'une telle base de données se posent inévitablement. Par conséquent, lors du choix d'un modèle de représentation des connaissances, des facteurs tels que l'uniformité de la représentation et la facilité de compréhension doivent être pris en compte. L'homogénéité de la présentation conduit à une simplification du mécanisme de gestion des connaissances. La facilité de compréhension est importante pour les utilisateurs de systèmes intelligents et les experts dont les connaissances sont intégrées dans le système d'information. Si la forme de représentation des connaissances est difficile à comprendre, alors les processus d’acquisition et d’interprétation des connaissances deviennent plus compliqués. Il convient de noter qu'il est assez difficile de répondre simultanément à ces exigences, en particulier dans les grands systèmes où la structuration et la représentation modulaire des connaissances deviennent inévitables.

La résolution des problèmes d'ingénierie des connaissances pose le problème de la conversion des informations reçues des experts sous forme de faits et de règles pour leur utilisation sous une forme qui peut être efficacement mise en œuvre grâce au traitement automatique de ces informations. À cette fin, divers modèles de représentation des connaissances ont été créés et utilisés dans les systèmes existants.

Les modèles classiques de représentation des connaissances comprennent des modèles de réseaux logiques, de production, de trame et sémantiques.

Chaque modèle possède son propre langage de représentation des connaissances. Cependant, en pratique, il est rarement possible de gérer dans le cadre d'un seul modèle lors du développement d'un système d'information, sauf dans les cas les plus simples, la représentation des connaissances s'avère donc complexe. En plus de la représentation combinée utilisant divers modèles, des outils spéciaux sont généralement utilisés pour refléter les caractéristiques de connaissances spécifiques sur le domaine, ainsi que diverses manières d'éliminer et de prendre en compte le flou et le caractère incomplet des connaissances.



Des questions ?

Signaler une faute de frappe

Texte qui sera envoyé à nos rédacteurs :