BIG DATA de Viktor Mayer-Schönberger et Kenneth Cukier

BIG DATA de Viktor Mayer-Schönberger et Kenneth Cukier Tous les 2/3 ans je me plonge dans un livre sérieux, à tendance économique et/ou technologique.
Cette année, je me lance dans ce livre très intéressant sur l'émergence du Big Data dans la vie de tous les jours.

Résumé:
Internet, les smartphones, les réseaux sociaux et toute la multiplication des capteurs de données provoquent une croissance exponentielle des données qui nous permettent de découvrir et de mieux visualiser tous les effets de masse, et les nouvelles tendances. Ce changement d'échelle conduit à un changement d'analyse. Le statisticien et sa sélection de l'échantillon représenttatif n'a plus de sens. Cette masse de données, le Big Data, bouleverse la nature de l'entreprise, mais également celle du gouvernement et bien sûr, la façon dont nous vivons tous, de nos ennuis de santé, de notre éducation jusqu'à toutes nos envies. Avec les "Big data", tout semble devenir prédictif.

Avec les éminents Viktor Mayer-Schönberger (de l'Oxford Internet Institute) et Kenneth Cukier (de "The Economist"), Big Data nous dévoile avec des exemples fascinants cette nouvelle façon de penser et des enjeux et menaces que le Big Data représentent pour nos sociétés, et surtout sur notre libre arbitre.

Ma note: ma note

Remarque: lu en anglais

Ma critique:

Œuvre de vulgarisation scientifique, le livre de Viktor Mayer-Schönberger et Kenneth Cukier est destiné à un public large et permet d'appréhender les enjeux du Big Data sur notre façon d'aborder notre façon de travailler, et cette quête sans fin de vouloir répondre aux besoins du client avant même que celui-ci ne l'exprimer; quête qui semble possible avec ce nouveau phénomène.
Ce livre est donc un état des lieux de ce nouvelle révolution de l'information, plus que sur la manière de traiter ces données: les informaticiens et autres architectes de l’information resteront donc sur leurs fins avec ce livre, s'ils attendent quelques pistes sur la façon d’amasser et de faire parler ces Big Data. Mais ce qui veulent comprendre l'intérêt, les débouchés possibles et les limites seront ravis par ce livre.

Le livre fait donc l'état des lieux, tant d'un point de vue technique, historique, qu'économique ou éthique.
Les bouleversements engendrés par l'émergence du big Data interviennent dances ces différents domaine:

  • La perte de dominance du code source "lisible": les programmes standards, programmés pour agir de façon logique, ne répondent pluss aux enjeux du Big Data, tant la donnée, ses sources et corrélations sont de plus en plus versatiles. Les algorithmes jouent sur le volume et sur la multitude, et non sur la logique pure et l'exactitude. Le code source ne fera plus loi, car il sera de plus en plus difficile de comprendre pourquoi un algorithme de Big Data ressort une véritable tendance sans que l'on comprenne vraiment sa causalité.
  • La corrélation en lieu et place de la causalité: Au lieu d'essayer de comprendre, le Big Data constate et en conclue des corrélations entre différents facteurs par forcément commun. L'objectif n'est pas de comprendre le pourquoi, mais uniquement le comment. Et la quantité de données et de sources nous mènent droit dans la corrélation. La causalité est mort, vive la corrélation!
  • L'algorithmiste, le nouveau métier de demain: A la fois statisticien, informaticien et marketeur, ce nouveau métier est au centre de ces nouveaux enjeux.
  • La fin de sa liberté "privée": Bien que les algorithmes des Big Data mettent de côté la notion même de l'individu, il en ressort 2 éléments importants
    - l'éceuil de la perte de l'anonymat; les tendances et comportements que mettent en lumière ces algorithmes se référrent forcément à des personnes, et avec les moteurs de recherches, il est facile de trouver de réelles personnes correspondant parfaitement à ces tendances, dont les données ont été captées et utilisées. En sachant que théoriquement, en 6 connaissances indirectes tout humain peut se rapprocher (voir théorie des 6° de séparations), et bien il suffit de quelques recoupements dans une analyse Big Data pour pointer du doigt sur la bonne personne, et ce sans besoin d'identifiant (nom, date de naissance, N° de sécu ou autre).
    - l'absence de contrôle des individus sur leurs données (non identitaires). Jusqu'ici, les CGV et autres lois sur la protection des données portent essentiellement sur les données purements identitaires et/ou leur retransmissions complètes. Rien ne portent sur l'éventuel redistribution d'une donnée anonymisé ou bien sur des usages et clics sur le site que vous effectuez, ou bien là où vous circulez. Rien ne protège le citoyen d'être hors champ du Big Data de toutes ces utilisations secondaires des données; d'autant plus que l'algorithme réutilisant ces données n'est pas encore imaginé.
  • Fracture entre les sociétés commerciales: Même si bon nombre de start-ups ont vu le jour dans ce domaine et rivalisant avec des gros acteurs en place, la possibilité de faire du BigData nécessite beaucoup d'argent, une économie d’échelle importante. Les grandes entreprises peuvent se permettent d'investir en machine de stockage, aspirateur de données et algorithmistes.
  • De la prévention à la discrimination: l'analyse de données Big Data aussi variées puissent-elles donnent des indicateurs, des tendances, qui fonctionnent dans 80% des cas. le logiciel de la police US PredPol, prédit quand et où auront lieu les prochains crimes: cela ne donne par encore l'identité des personnes; comme dans Minority Report, mais d'autres analyses montrent bien que le fait de s'appeler Jimmy ou Kevin est déjà un handicap dans la vie; etc. Bref, ces tendances étiquettent et catégorisent des gens, qui se verront peu à peu fermer les portes des meilleurs écoles, ou d'accès au meilleurs soins et autres besoins de consommations (prêts; voyages; etc.). La discrimination et la catégorisation des individus vont s'accentuer.
  • Absence de réflexion politique (éthique): Et pour cause, nos gouvernements sont les premiers à tirer profit de toutes ces données et à vrai dire, les lobbys industriels et du grand commerce préfèrent que ce genre de réflexion reste dans l’œuf.
  • Vers la fin du libre arbitre?: Les auteurs font une peinture bien noire sur notre libre arbitre, qui en prend un sacré coup. Puisque presque tout peut se corréler pour donner une tendance, alors les choix et décisions de M. Toutlemonde peuvent se deviner à l'avance. Et plus les big-data permettront d'identifier et de proposer nos envies avant mêmes qu'elles ne deviennent; et pourront nous écarter de nos déviances.

Pour conclure, Viktor Mayer-Schönberger et Kenneth Cukier terminent par une note humaniste et optimiste, que les Big-data se réguleront d'eux-mêmes. mais je n'en suis pas si sûr: les états sont et resterons au-dessus des lois, et les entreprises sont des êtres impersonnels, sans mémoires ni reconnaissance envers ses individus. George Orwell ne s'était pas trompé, même si ce n'est plus Big Brother, mais bel et bien "BigData that is watching you".

Quelques liens:

La discussion continue ailleurs

URL de rétrolien : http://www.atoma.org/atopia-v3/index.php?trackback/548

Fil des commentaires de ce billet