Chapitre V.2 - Services logiciels et technologies intelligentes pour le Big Data
Résumé
L’émergence des réseaux sociaux, l’informatique ambiante, le Web ou l’intelligence économique ont profondément remodelé notre rapport aux sciences de l’information et de la communication et à leurs applications. Le succès de l’économie numérique, la généralisation des équipements mobiles et le développement des applications associées (loisirs, savoir numérique, etc.) sont autant d’exemples conduisant à des améliorations significatives dans les domaines des sciences (observatoire virtuel en astronomie, cartographie du génome, physique et énergie), de la santé et du bien-être (aide aux personnes âgées et au handicap, chirurgie assistée) et des humanités (sciences sociales). Ces efforts concernent également le développement de nouveaux services pour la ville, le transport et la durabilité de l’environnement en général (efficacité énergétique, climat, pollution, alimentation). À cela s’ajoute l’avènement de politiques de type « données ouvertes » (ou open data) visant à rendre libres, accessibles et exploitables des informations publiques.
Dans ce contexte bouillonnant, les données sont élaborées, commercialisées et consommées comme n’importe quels produits manufacturés. Elles sont au coeur de processus informatiques, souvent complexes, mobilisant un grand nombre de ressources (informations, applications, services) et nécessitant des procédés rigoureux. Elles sont au coeur de l’économie numérique et de la société du savoir. Elles représentent une matière première à forte valeur ajoutée, dont il est difficile de se passer. Quelles solutions pour gérer des gros volumes de données hétérogènes et produites en temps réel ? Comment concevoir des infrastructures permettant leur traitement efficace pour construire des applications qui facilitent la vie des personnes ? Quelle solution pour gérer ses données personnelles ? Quelles garanties sont attendues pour rendre ces données accessibles à tout moment mais en garantissant leur sécurité et leur confidentialité ? Comment rendre le contrôle aux utilisateurs et aux
utilisatrices avec peu de connaissances techniques ?
La globalisation des données et des ressources nécessaires pour les traiter (calcul et stockage) est le défi majeur auquel sont confrontés les systèmes informatiques et les infrastructures de gestion de données dans lesquelles les SGBD jouent un rôle essentiel. Ces infrastructures évoluent dans leurs fonctions et leurs architectures au profit d’infrastructures logicielles modulaires, réparties, ouvertes et personnalisables pour des systèmes à différentes échelles et pour cibler des applications variées.
Pour répondre à certains des défis qui viennent d’être évoqués, nous présentons ici plusieurs travaux effectués depuis 2000 par l’équipe Bases de Données de Grenoble. Ces travaux ont été menés principalement au travers des projets NODS et HADAS dirigés par Christine Collet assistée principalement de Genoveva Vargas-Solar.