Numéro 8 - Mai 2013
Web Science

ÉDITORIAL

Dans un récent article du New York Times, Alex Pentland, Directeur du Human Dynamics Lab du MIT admettait que les sociétés du futur seront "pilotées par les données" et que les capacités technologiques offertes par l'exploitation des "Big Data" laisseront Georges Orwell le nez dans la poussière ! Ces prédictions peu rassurantes traduisent l'inquiétude que crée l'utilisation de ces quantités astronomiques d'information aujourd'hui stockées dans les bases de données des états, entreprises et organisations en tout genre.

Selon IBM, Chaque jour, nous générons 2,5 trillions d’octets de données. A tel point que 90% des données dans le monde ont été créées au cours des deux dernières années seulement. Ces données proviennent de l’usage que nous faisons des réseaux informatiques : Messages sur les médias sociaux, d'images et vidéos publiées en ligne, d'enregistrements transactionnels d'achats en ligne et de signaux GPS de téléphones mobiles, interactions avec le gouvernement. Ces données sont appelées Big Data ou volumes massifs de données.

Notre dossier du mois revient sur différents enjeux de l'utilisation de ces big data.

DOSSIER : Big Data

(Cliquez pour voir toute l'infographie)

Les réseaux informatiques ont cette capacité intrinsèque de pouvoir enregistrer l'intégralité de toutes les actions portées par les utilisateurs des services qu'ils proposent : chaque interaction avec un serveur Web, par exemple, est systématiquement enregistrée, stockée et peut être analysée de façon statistique. Or, avec l'augmentation proportionnelle des usages et des capacités de stockage, la quantité de données d'information disponibles sur les réseaux dépasse aujourd'hui les 1024 bytes.

Ces gigantesques bases de données éparpillées aux quatre coins du monde et appartenant à des entreprises, des organisations internationales ou des gouvernements sont exploitées à différentes fins, commerciales ou purement statistiques. De véritables mines d’or pour les entreprises qui peuvent ainsi mieux connaître et cibler leur clientèle.

Et avec plus de 50 milliards d’objets connectés au réseau Internet et géo-localisables en 2020, les Big Data représentent le plus grand enjeu industriel et économique du XXIème siècle. Pourtant, leur exploitation pose de nombreux problèmes : sur le plan économique, si volume, variété et vitesse sont des enjeux essentiels, la qualité et la véracité des données demandent une accélération des moyens d’indexation sémantique et de marquage de ces informations.

Mais l’enjeu fondamental des Big Data, c’est le cadre éthique dans lequel elles sont utilisées : respect de la vie privée, surveillance, contrôle forcé des décisions individuelles.  Plusieurs états réfléchissent à des législations adaptées pour protéger les utilisateurs et leur donner accès aux informations les concernant.

Notre dossier propose plusieurs articles abordant ces différents aspects des enjeux des Big Data.

Article du journal La Tribune, incluant un lexique assez complet du vocabulaire des "Big Data"

Le rapport du World Economic Forum sur les Big Data, préparé par le Boston Consulting Group

Article de Steve Lohr pour le New York Times

Un rapport complet de McKinsley sur les technologies avancées et leurs modèles d'affaire

Ce site a vocation à fédérer l'ensemble des acteurs engagés dans un projet de Partage des Données Publiques en France.

Un papier de Jim Hendler, du Department of Computer Science and Cognitive Science Department Rensselaer Polytechnic Institute Troy, New York et co-fondateur de la Web Science.






 

(Tous les dossiers sont mis à jour régulièrement sur : webscience.blogs.usj.edu.lb)

 

ACTUALITÉS

Actualités de l'UIR Web Science - CEMAM

L’UIR Web Science a participé à la Conférence ACM 2013 à Paris. Rapport complet ici des activités.

Visitez le site du workshop Web Science Education organisé par l'UIR

Christophe Varin et Stéphane Bazan, chercheurs à l'UIR ont publié un article sur le Web arabe dans la prestigieuse revue "Etvdes". Lire l'article.

L'UIR a tenu le 22 mars 2013 un séminaire ouvert sur la Cyberguerre. Sabrine Saad, Addis Tesfa, Saada Kalakesh et Sofia El Amine ont présenté chacun un thème de ce nouveau danger pour les états et les entreprises.

Dernières infos de la Web Science

L'UIR participe le 12 juin à un Webinar proposé par le Web Science Trust, qui devrait permettre aux 4 meilleurs posters scientifiques de la conférence Web Science 2013 d'être présentés aux internautes.

About ACM Web Science 2013

Best papers

Catherine C. Marshall and Frank M. Shipman: Experiences Surveying the Crowd: Reflections on methods, participation, and reliability

Bernhard Rieder: Studying Facebook via Data Extraction: The Netvizz Application

Best poster

Web Science for Ancient History : Deciphering Proto-elamite online

Discussion vizualisation

On Storify, By Anne McCrossan: http://storify.com/annemcx/webscience-13

Ramine Tinati's corner: Websci13 retweets network.

Blogs

PhD Progress Blog by Chris Phethean

A PROPOS DE LA NEWSLETTER

Rédaction :
Sofia El Amine
Stéphane Bazan
Sabrine Saad
Addis Tesfa
Christophe Varin

S'abonner / Se désabonner

Contact

uir.webscience@usj.edu.lb
webscience.blogs.usj.edu.lb
Twitter : @uirwebscience
Facebook