Visualisation humaine interactive. Visualisation interactive des données comme outil de gestion d'entreprise. Déterminer le but exact du produit

Aujourd'hui, dans le domaine de la visualisation, des méthodes sont explorées pour transformer les données en images visuelles pour une meilleure compréhension de l'information. L'une des représentations visuelles les plus courantes, le graphique linéaire, est utilisée depuis plus de mille ans. Et des outils tels que le graphique à barres et à secteurs, le nuage de points et l'histogramme ont été inventés il y a plus de deux siècles.

Beaucoup de temps s'est écoulé depuis et les progrès ne se sont pas arrêtés. Désormais, les utilisateurs ont à leur disposition des dizaines de programmes qui leur permettent de visualiser les données. Dans le même temps, la visualisation a longtemps "migré" vers l'espace tridimensionnel : les scientifiques l'utilisent pour visualiser les résultats de la recherche, les météorologues réalisent des cartes météorologiques, les gestionnaires utilisent des modèles de données 3D pour prendre des décisions de gestion rapides et efficaces.

Mais le développement des technologies de visualisation s'arrêtera-t-il là ? Bien sûr que non. Qu'est-ce qui nous attend dans le futur ? La réponse à cette question peut être trouvée en retraçant l'histoire de la visualisation, car ce n'est pas en vain qu'ils disent : « Sans connaissance du passé, il n'y a pas d'avenir ».

Une brève excursion dans l'histoire

Puisque nous parlons de visualisation, présentons son histoire sous une forme visuelle - c'est ainsi qu'elle a été dépeinte par Michael Friendly, auteur du Handbook of Data Visualization :

Avant le 17e siècle - Premières cartes et schémas

La première graine de visualisation est née dans les diagrammes géométriques, dans les tableaux des positions des étoiles, les illustrations des parties du corps et les cartes de navigation.

Parmi les premiers affichages d'informations quantitatives figure un graphique du mouvement des corps stellaires, qui montre le mouvement des planètes dans un système de coordonnées bidimensionnel. Ce graphique illustre bien cette période :

1600-1699 - Mesures et théories

Au XVIIe siècle, les scientifiques s'intéressaient à la mesure du temps, de la distance et de l'espace. L'accent était mis sur les cartes et la navigation.

C'est durant cette période que le système de coordonnées est apparu, la théorie de la fidélité et les statistiques démographiques sont nées.

Une illustration de cette époque peut servir d'œuvre de Christopher Scheiner (Christopher Scheiner), datée de 1630. Plus tard, Edward Tufte a utilisé le terme "petits ensembles" pour cela, signifiant par là la répétition d'un élément plusieurs fois pour refléter la dynamique et les changements qui se produisent.

Cette image montre les taches solaires observées au cours du mois :

1700-1799 - Nouvelles formes graphiques

Le XVIIIe siècle est le moment d'aller au-delà de « l'évidence ». Sur les cartes, ils essaient maintenant d'afficher non seulement un point de localisation géographique, mais des contours et des isolignes apparaissent.

Exemples d'époque : cartes thématiques de failles géologiques, calculs économiques et illustrations médicales. Les visualisations abstraites deviennent de plus en plus courantes. De plus en plus d'informations sur les événements politiques et économiques commencent à s'accumuler et, par conséquent, de nouvelles formes visuelles sont nécessaires pour les afficher.

Vous trouverez ci-dessous l'un des premiers exemples de superposition de données supplémentaires sur une carte géographique :

1850 - Début du graphisme moderne

À cette époque, les principaux types de graphiques sont apparus: graphiques circulaires, à barres, en aires. Le point de départ du graphisme moderne est la fameuse visualisation du choléra dans les rues de Londres, réalisée par John Snow :

En 1858, la Sœur de la Charité et personnalité publique de Grande-Bretagne Florence Nightingale a inventé le premier diagramme à secteurs - elle l'a utilisé pendant la guerre de Crimée pour montrer que beaucoup plus de soldats sont morts de maladie (bleu) que sur le champ de bataille (rouge) ou d'autres causes (noir). ):

1900-1950 - Les années troubles

Le raisonnement philosophique et la division des gens en «plus visuels» et «plus tabulaires» ont commencé. Les Britanniques se considéraient comme plus tabulaires. La devise de la British Academy à cette époque était la collecte de données ("collection de grains de blé"), mais la visualisation, à leur avis, faisait déjà partie de la série de boulangerie.

1950 - 1975 - Renaissance

Les scientifiques et les écrivains ont commencé à populariser activement les idées de visualisation. Des œuvres similaires sont sorties littéralement les unes après les autres. En 1962, John Tukey a écrit The Future of Data Analysis, séparant les mathématiques des statistiques. Et si le premier ne tolère pas les visualisations, alors les statistiques prennent juste plus de sens et de forme grâce à elles.

A cette époque, les premières visualisations interactives apparaissent. Un exemple est la visualisation de Richard Baker :

En 1973, le scientifique américain Herman Chernov a utilisé des images de visages pour visualiser des données. Les visages de Chernoff sont un affichage de données multidimensionnelles sous la forme d'un visage humain, ses parties individuelles. Ci-dessous un exemple de l'évaluation par les avocats de 12 juges selon Chernov's Faces :

1975 - présent – Visualisation haute résolution interactive et dynamique

Aujourd'hui, nous avons un large accès aux outils d'analyse et de visualisation des données. Les moments clés qui ont marqué l'ère de la visualisation interactive et dynamique peuvent être considérés comme l'émergence de systèmes interactifs, la capacité d'interagir avec des modèles (y compris 3D), une augmentation de la puissance des ordinateurs ainsi qu'une réduction du coût de la technologie.

Sans aucun doute, l'émergence d'Internet et, par conséquent, l'accès à de grandes quantités de données ont joué un rôle clé dans ce processus.

Un excellent exemple de visualisations de cette époque est la visualisation Internet par le projet Opte :

Le nombre de sources de données et d'outils de traitement de données disponibles aujourd'hui est en soi une indication claire que jamais autant de personnes n'ont essayé de se familiariser avec le monde de la visualisation de données. Et quand il y a tant de matériaux disponibles pour l'étude, il n'y a qu'une seule question "Où commencer?" peut effrayer tous les débutants. Alors, quelles sont les meilleures bibliothèques et que recommandent les pros ? Cela sera discuté dans cet article.

Parler de visualisation de données sans en parler, c'est comme parler de l'histoire des ordinateurs personnels et ne pas dire un mot sur Steve Jobs. D3 (de l'anglais Data Driven Documents) est, sans exagération, la bibliothèque JavaScript open source la plus importante et la plus dominante du marché, couramment utilisée pour créer des graphiques SVG. Le SVG (de l'anglais Scalable Vector Graphics) est quant à lui un format d'image vectorielle supporté par les navigateurs web, mais jusqu'alors peu utilisé.

La bibliothèque D3 doit une grande partie de sa popularité à l'intérêt soudain pour SVG de la part des concepteurs de sites Web, qui est en grande partie dû à la façon dont les graphiques vectoriels semblent avantageux sur les écrans haute résolution (en particulier, sur les écrans Retina utilisés dans les appareils Apple), qui sont devenant de plus en plus courant.

"Soyons honnêtes, si la tâche consiste à visualiser des données basées sur SVG, toutes les autres bibliothèques n'étaient même pas près de le résoudre", déclare Moritz Stefaner, expert indépendant en visualisation de données et propriétaire de l'entreprise. Vérité & Beauté. « Il existe également de nombreux projets intéressants basés sur D3, tels que NVD3, qui fournit des composants graphiques standard - prêts à l'emploi, mais personnalisables ; ou, disons, Crossfilter est simplement un outil de filtrage de données exceptionnel.

Processing.js est un projet frère de Processing qui vous permet de visualiser des données à l'aide de standards Web sans avoir besoin de plugins. "Vous n'avez pas besoin de connaître JavaScript pour démarrer avec Processing car Processing possède son propre langage de programmation", explique l'expert en visualisation de données Jan Willem Tulp des Pays-Bas. En tant qu'utilisateur, il vous suffit d'écrire du code de traitement, de le coller dans votre page Web et de laisser Processing.js s'occuper du reste."

"Le point négatif vous attend lorsque vous commencez à travailler sur des projets plus complexes : l'IDE (de l'anglais. Integrated Development Environment) vous paraîtra un peu limité", poursuit Jan Willem Tulp.

Et malgré cela, la simplicité inhérente de Processing, ainsi qu'une large communauté d'utilisateurs, à tout moment prête à aider ceux qui sont confrontés à un problème, comblent ce manque et font de Processing l'un des outils les plus accessibles pour la visualisation de données.

Alors que D3 et Processing fournissent des outils communs pour différents types de visualisation, Géphi résout des problèmes plus spécifiques. Gephi est une bibliothèque gratuite et open source pour la visualisation de réseau. Mais même dans cette spécificité étroite, Gephi offre une mer de possibilités. Que vous souhaitiez modéliser les relations entre les employés au sein d'une entreprise ou les passes de balles lors d'un match de football, avec Gephi vous pouvez visualiser ces relations.

Comme Processing, Gephi est très facile à installer. Immédiatement après l'installation, importez les données, triez et vous pouvez commencer à visualiser. "Les images obtenues peuvent être exportées et collées dans n'importe quel document Web pour que votre public puisse les utiliser et les partager sur le Web", explique Benjamin Wiederkehr.

Dygraphes

Dygraphes est une bibliothèque JavaScript open source rapide et flexible conçue pour créer des graphiques interactifs et vous permettant d'analyser et d'interpréter des ensembles de données très denses. Contrairement à Vega, la bibliothèque Dygraphs propose des paramètres personnalisés mais a le même avantage de fonctionner dans tous les principaux navigateurs. De plus, Dygraphs est nativement interactif, ce qui signifie que certaines fonctionnalités (telles que le zoom, le panoramique ou le survol de la souris) sont présentes par défaut, alors que, par exemple, la fonction "pincer pour zoomer" sur les appareils mobiles n'est déjà qu'une belle touche. prime.

Où commencer?

Même avec de telles informations, le monde de la visualisation de données peut sembler une forêt sombre pour un débutant. Alors que conseillent les experts ?

"La première chose que je suggérerais est d'apprendre à connaître autant d'outils qu'il existe aujourd'hui pour créer rapidement des graphiques standard", déclare Moritz Stefaner. « Surtout au début d'un projet, il est très important de pouvoir générer rapidement de nombreux graphiques afin d'explorer le volume, la profondeur et la texture des données. Personnellement, j'utilise Tableau et Gephi, mais en plus d'eux, CartoDB est indispensable pour travailler avec des cartes, et la bibliothèque open source RAW apparue plus récemment, idéale pour créer rapidement des graphiques intéressants.

Vous devez également vous assurer que la bibliothèque que vous choisissez correspond le mieux aux informations que vous souhaitez afficher.

« Il est très important de vous demander dès le départ avec quel type de format de données vous allez travailler », déclare Scott Murray. « La tâche est de visualiser la période de temps ? Peut-être que ce sont des données catégorielles? Les réponses à de telles questions peuvent influencer votre décision. Certaines bibliothèques, comme D3, sont génériques et peuvent fonctionner avec différents types de données. D'autres sont plus spécifiques en termes de types de données, comme Gephi ou Sigma.js, des outils conçus pour la visualisation de réseaux. Si vous savez dès le départ avec quoi vous travaillez, choisissez soigneusement parmi les bibliothèques existantes celle qui convient le mieux à votre type de données."

Quels sont les avantages d'une communauté en ligne ?

Pour ceux qui débutent dans la visualisation de données, un point important dans le choix d'une bibliothèque est la présence d'une communauté locale, dont les membres sont passionnés par leur travail et prêts à aider.

"Pour les débutants, je conseillerais de commencer la bibliothèque Processing ou D3", déclare Jan Willem Tulp. "Les deux ont une large base d'utilisateurs et un bon nombre d'exemples à partir desquels apprendre."

La communauté en ligne dans le domaine de la visualisation de données fournit non seulement des réponses à de nombreuses questions, mais démontre également clairement l'un des principaux paradoxes de l'infographie. Chacun arrive dans l'industrie avec sa propre formation et expérience, c'est pourquoi certains professionnels de la visualisation de données abordent les tâches d'un point de vue esthétique et artistique, tandis que d'autres se concentrent sur l'aspect statistique du problème. Les statisticiens sont doués pour traiter de grandes quantités de données, mais ils doivent apprendre les bases de la conception. Les concepteurs en savent beaucoup sur la création d'images esthétiques, mais ils ont beaucoup à apprendre sur les méthodes statistiques.

"Au centre de tout, il y a l'accord des parties sur le type de visualisation", explique le programmeur-concepteur

Comme son nom l'indique, la visualisation de données est une représentation graphique de n'importe quelle donnée. Parallèlement, sur Internet, j'ai trouvé de nombreuses définitions qui se rapportent à la data visualisation :

  • Graphiques et graphiques,
  • Infographies et schémas,
  • Présentation et analyse des données,
  • narration interactive,
  • Analyses commerciales et tableaux de bord,
  • Imagerie scientifique et médicale,
  • Cartes et cartogrammes.

Ensuite, chacun décide par lui-même - ce que signifie pour lui la visualisation des données. À la fin de la note, je vous dirai ce que j'ai décidé pour moi-même. En attendant, examinons chacun des types plus en détail et trouvons leurs différences et leurs caractéristiques.

Graphiques et tableaux

Probablement le type de visualisation de données le plus familier pour nous. Utilisé à la fois pour la présentation et l'analyse des données. Vous pouvez les rencontrer à la fois au travail, dans un journal et dans un rapport scientifique. Habituellement, nous obtenons des connaissances sur les types de tableaux et de graphiques existants à l'école ou à partir d'un ensemble standard dans Excel. Cependant, peu de gens savent que le monde des graphiques et des diagrammes ne se limite pas aux diagrammes de dispersion, à barres et à secteurs. Il existe environ 15 types de graphiques bien connus, et il y en a plus de 60 au total, et leur nombre augmente chaque jour - les gens proposent de nouveaux types pour visualiser des données complexes et inhabituelles. Nous examinerons en détail les types de graphiques et de tableaux dans l'une des notes suivantes.




Infographies et schémas

Les infographies sont devenues très populaires ces dernières années, bien qu'elles existent depuis longtemps. L'infographie fait référence au journalisme de données, où des graphiques et des tableaux expliquent certains faits sur un sujet choisi. Habituellement, les infographies sont statiques et constituent une longue "feuille" avec des images et du texte. Une caractéristique distinctive de l'infographie est qu'elle fournit des conclusions toutes faites, c'est-à-dire que le lecteur est guidé par la main sur le sujet choisi et en même temps assaisonné de chiffres et d'images. Un style dessiné ou cartoon est souvent utilisé. Certains médias publient quotidiennement des infographies, comme l'AIF. Le boom de l'infographie a provoqué une baisse du niveau global de sa qualité. Souvent utilisé hors de propos ou "pour la beauté", bien qu'il existe bien sûr des exemples merveilleux et intéressants.

Exemples d'infographie

Le nombre de l'armée napoléonienne pendant la compagnie russe, 1869

Population de différents pays, 1912

10 commandements de la typographie

battant des ailes

Les végétariens en chiffres

Présentation et analyse des données

L'une des façons les plus courantes d'utiliser la visualisation de données consiste à présenter des informations sous forme de graphiques ou d'infographies. Et si avec cela, je pense que tout est clair, alors l'utilisation de la visualisation pour l'analyse de l'information n'est principalement utilisée que par les analystes commerciaux et les scientifiques. Quelle est la différence?

Lors de l'analyse de données à l'aide de la visualisation, le soi-disant prototypage rapide est utilisé, c'est-à-dire la création d'un grand nombre de représentations visuelles différentes des mêmes données. Ceci est fait afin de pouvoir trouver, à première vue, des relations et des dépendances cachées, ainsi que pour évaluer initialement l'ensemble de données afin de pouvoir utiliser des outils d'analyse plus complexes à l'avenir. Cette approche est appelée analyse exploratoire des données (EDA), qui peut être traduite en russe par analyse exploratoire des données. La principale différence avec la présentation des données est que la visualisation ici peut être "brute" et laide, mais elle est faite rapidement et par une seule personne ou un petit groupe de travail. Pour cela, Excel, R ou Matlab sont le plus souvent utilisés.

EDA est l'un des outils d'exploration de données, il existe même des manuels pour sa mise en œuvre

Exemples de visualisation pour EDA





Narration interactive

La narration ou la narration en russe (semble drôle) est la présentation d'informations utiles sous la forme d'une histoire intéressante. Pour une raison quelconque, les vidéos sont souvent appelées narration interactive, mais ce n'est pas le cas, c'est juste un autre type d'infographie. La narration interactive est une histoire avec laquelle l'auditeur peut interagir. À la base, il est proche du journalisme de données et de l'infographie, mais diffère en ce que l'utilisateur peut contrôler l'affichage des informations et trouver les dépendances que l'auteur n'a pas trouvées. En ce sens, il est proche de l'analyse exploratoire des données, mais diffère en ce que les données sont prétraitées et présentées sous une forme pratique pour l'analyse, ainsi qu'il existe des indices ou des cas d'utilisation prédéfinis. Par conséquent, le plus souvent, la narration interactive est appelée infographie interactive, mais pour en devenir une, il ne suffit pas d'ajouter des fenêtres contextuelles aux infographies statiques.
Les visualisations interactives se développent activement à notre époque. Des exemples forts peuvent être trouvés dans les grands médias ou en tant que projets individuels.

Exemples de storytelling interactif (aller sur le site en cliquant sur l'image)

Analyses commerciales et tableaux de bord,

La visualisation est activement utilisée dans les affaires. Le principe de « parler aux données » aide les entreprises à gagner plus et les clients reçoivent un meilleur service. Pour une analyse ponctuelle, on utilise généralement Excel ou R. Cependant, cela n'est pas pratique si vous devez surveiller certains indicateurs (KPI) de manière continue. Pour suivre les KPI de routine, des tableaux de bord sont utilisés - des affichages qui affichent tous les indicateurs nécessaires en un seul endroit sous forme de graphiques, de tableaux et de tableaux.

Concevoir des tableaux de bord efficaces est une tâche complexe et extraordinaire. Souvent, ils sont surchargés d'informations inutiles ou essaient d'utiliser tous les types de modèles de graphiques possibles. Souvent, pour concevoir un bon tableau de bord, il est nécessaire de créer de nouveaux types de visualisation des informations. Le sujet se développe activement en raison de l'utilisation croissante de l'analytique dans les entreprises. Les tableaux de bord sont également utilisés à des fins personnelles (suivi de la condition physique, analyse des dépenses personnelles, etc.)

Les cartes sont l'un des moyens les plus anciens de visualiser la réalité environnante. Un cartogramme est une carte sur laquelle sont imprimées des informations sous forme de couleur ou d'une autre manière. Je ne serai peut-être pas précis avec les termes ici, mais les cartographes me pardonneront. Les cartogrammes peuvent être utilisés pour afficher n'importe quoi, de la densité de population à la fréquence des jurons dans chaque région du pays. Ils peuvent être utilisés dans tous les types de visualisations dont nous avons parlé précédemment. Je les ai distingués dans un paragraphe séparé, car leur mise en œuvre est assez différente des autres types de visualisations (nous attendons une note à ce sujet).

Exemples de cartogrammes (aller sur le site en cliquant sur l'image)

Résumé

La note est étonnamment grande. C'est peut-être bien, vous pouvez immédiatement voir tout ce qu'il y a dans le monde de la visualisation de données. Qu'est-ce que j'entends par ce concept et de quoi sera-t-il question dans ce blog ?
Pour moi, la présentation des données est principalement associée aux graphiques et tableaux, ainsi qu'aux infographies interactives. C'est à cela que sera consacrée l'essentiel des notes, il sera également intéressant de se plonger dans les cartes et les tableaux de bord.



Avoir des questions?

Signaler une faute de frappe

Texte à envoyer à nos rédacteurs :