Archivage numérique : les nouveaux enjeux économiques du Big Data

Par Bernard M.
Publié le 14 mars 2013 à 10:03

Retour avec le Centre Informatique National de l’Enseignement Supérieur (CINES) sur les bonnes pratiques liées au déploiement et à la mutualisation d’une solution d’archivage évolutive. En devenant tiers archiveur, le CINES ouvre son infrastructure à de nouveaux interlocuteurs. Il réalise des économies d’échelle et accroît considérablement sa compétitivité.

Retour avec le Centre Informatique National de l’Enseignement Supérieur (CINES) sur les bonnes pratiques liées au déploiement et à la mutualisation d’une solution d’archivage évolutive. En devenant tiers archiveur, le CINES ouvre son infrastructure à de nouveaux interlocuteurs. Il réalise des économies d’échelle et accroît considérablement sa compétitivité. Le CINES, Centre Informatique National de l’Enseignement Supérieur, est un établissement public, créé en 1999, sous tutelle du Ministère de l’Enseignement Supérieur et de la Recherche, qui prend la suite du CNUSC, Centre National Universitaire Sud de Calcul. Depuis 1980 les supercalculateurs français parmi les plus puissants ont été hébergés dans les salles machines du Centre. À partir de 2006, le CINES travaille à la mise en place d’une solution permettant d’assurer la conservation et l’archivage numérique des documents et données générés par la communauté de l’enseignement supérieur et de la recherche. En 2008 l’archivage pérenne de données numériques est officiellement déclaré par la tutelle mission statutaire du CINES. Une nouvelle activité instaurée par décret qui définit notamment les modalités de dépôt, de signalement, de reproduction, de diffusion et de conservation des thèses électroniques. Pour répondre à ces besoins, le centre conçoit initialement une solution d’archivage basée sur des composants logiciels libres. Une première mise en production est réalisée dès la fin de l’année 2006 pour couvrir un volume documentaire de plusieurs milliers de thèses par an. Cette solution répond à l’ensemble des exigences d’archivage en vigueur et spécifiées par la norme ISO 14721. Cependant, dès le début de l’année 2008, le volume des données devant être archivées augmente, les bibliothèques universitaires prenant conscience de la nécessité de numériser leurs fonds patrimoniaux. Le CINES voit, dès lors, son activité croître considérablement. Le centre gère alors plusieurs Tera-octets de données. Face à la croissance prévue sur les années à venir, le CINES décide de lancer un appel d’offre pour la mise en place d’une plate-forme d’archivage qui lui permettra de relever ce nouveau challenge. Outre le fait qu’elle doive offrir l’ensemble des conditions techniques permettant d’assurer l’intégrité des données, cette nouvelle plate-forme devra être extrêmement évolutive. La solution déployée doit, dès lors, pouvoir offrir une qualité de service et des performances optimales quel que soit le volume de données engagé. Le CINES a retenu la solution Arcsys. Le déploiement est réalisé en près de cinq mois et la plate-forme obtient l’agrément SIAF, Service Interministériel des Archives de France, deux ans plus tard, en 2010. L’infrastructure repose sur le déploiement de deux serveurs applicatifs reliée à deux baies de stockage Fibre Channel d’une capacité totale de 40To évolutive jusqu’à 150To. En l’espace de quelques mois d’exploitation, près de 600 000 documents sont archivés. Le CINES travaille aujourd’hui en étroite collaboration avec les principaux centres informatiques, des bibliothèques universitaires et des organismes de recherche nationaux. Rapidement, les politiques gouvernementales définissent de nouveaux axes et engagent des actions visant à réduire et à mutualiser les infrastructures existantes. En 2012, son activité est étendue à l’archivage intermédiaire de documents administratifs, et le Centre devient le tiers archiveur de la Cour des Comptes. Une activité nouvelle qui marque un tournant et de nouvelles perspectives pour le CINES. « Nous allons progressivement mutualiser nos ressources avec un nombre toujours plus important de partenaires. Nous disposons en effet d’une infrastructure et d’une solution d’archivage d’excellence. Aujourd’hui, nous avons un volume de données de 40To, nous avons la capacité de gérer en toute confiance jusqu’à 150To de documents numérisés. En devenant tiers archiveur, nous avons un nombre considérable de perspectives qui s’offrent à nous. Mutualiser pour effectuer des économies d’échelle, c’est une règle que nous appliquons avec succès au CINES. En 2012, nous avons accru notre activité et avons dès lors directement impacté cette croissance sur nos coûts. Ainsi, nous avons pu répercuter une baisse de 20% sur la tarification annuelle du Tera-octet de données archivé, » explique Olivier Rouchon, Responsable du Département Archivage et Diffusion. « Pour un grand nombre d’entreprises, la question des coûts est un enjeu récurrent. Cependant, la problématique n’est pas uniquement de trouver la solution la plus économique mais de veiller à disposer d’une plate-forme qui puisse offrir une fiabilité optimale et une flexibilité quelle que soit le volume de données concernées. Le coût de possession doit toujours être raisonnable y compris au démarrage du projet quand les volumétries initiales sont faibles. La plate-forme doit pouvoir évoluer et fournir une charge de plus en plus importante sans qu’il y ait d’impact budgétaire insensé. Deux conditions qui prévalent de plus en plus pour nos interlocuteurs, »précise Dominique Lhopital, Directeur Général d’Arcsys Software.