dimanche 1 juin 2008

De la GED au Web 4.0

Voici un petit article, rédigé en collaboration avec Laurent Le Foll, suite à la parution du livre blanc sur la valorisation de l'information non-structurée, où l'on trouve l'explication du nom de ce blog.


L’histoire des systèmes d’informations est faite d’une série de jalons caractérisés à la fois par la nature de l’information sur laquelle ces systèmes opèrent, et par le lieu où cette information est gérée. Tout d’abord dévolus aux traitements comptables lourds, les systèmes d’information ont géré de l’information de moins en moins structurée. Cette évolution s’est effectuée par paliers successifs : l’apparition des techniques de numérisation a permis la dématérialisation des documents, et ce fut l’essor de la Gestion Electronique de Documents. L’intégration de la GED à l’ensemble de l’entreprise avec, comme conséquence, la capacité à gérer l’ensemble du contenu d’entreprise, ainsi que son cycle de vie ont consacré a permis l’apparition de la gestion de contenu (ou ECM pour Electronic Content Management) ; l’expansion d’Internet et la mise disponibilité de grandes quantités d’information a contribué à l’envolée des techniques de traitement du texte : moteurs de recherches tout d’abord, puis techniques de fouilles et d’analyse évoluées de texte ensuite.

Par ailleurs, de même que les Progiciel de Gestion Intégrée ont permis d’optimiser la gestion de l’information structurée au niveau de l’ensemble de l’entreprise, l’ECM permet aujourd'hui de gérer l’information non-structurée.

Au delà du système d’information, les règles de la nouvelle économie consacrent l’importance croissante du capital immatériel – dont l’information non-structurée est une composante indéniable – par rapport au pur bilan comptable.

On assiste aujourd’hui à une convergences entre plusieurs mouvements. L’usage d’internet couvre de nouveaux territoires : relations entre les citoyens et l’administration, mais également entre un utilisateur et son logiciel - voir l’exemple les dernières évolutions de Google avec sa suite burautique.

Un autre mouvement concerne la structuration des connaissances : le thésaurus laisse graduellement sa place au Web Semantic, plus riche dans ses capacités d’indexation et de calcul et, surtout, beaucoup plus partagé.

Enfin, les supports technologiques de l’information deviennent de plus en plus granulaires et il devient dès lors possible de construire des documents composites de + en+ et multimedia . Les technologies linguistiques contribuent à ces mouvements, en fournissant des moyens d’analyse et de structuration de l’information.

Lorsque le terme Web2.0 est apparu, il s’agissait simplement pour quelques responsables marketing de trouver un titre à une prochaine conférence. Si le mot a ainsi précédé la chose, le contexte était favorable puisque l’expression s’est largement répandue et qu’un consensus est apparu quant à son contenu. Ainsi, le principe de base du Web 2.0 est la notion de démocratisation du web, c’est à dire la capacité donnée à tout membre de l’Internet-Land de contribuer à son enrichissement. Des moyens nouveaux sont désormais disponibles pour que chacun puisse partager avec tous de l’information (par mail, blog, ou messagerie instantanée), des connaissances (wikis, signets collaboratifs, folksonomie) ou des savoir-faire (réseaux sociaux, portails collaboratifs).

Le mouvement amorcés qui fait des technologies Internet le mode de diffusion pratiquement exclusif de l’information, dans des applications de plus en plus complexes, intégrant le travail collaboratif, la gestion des processus et de cycle de vie, la sécurité ou les profils utilisateurs ne peut que se confirmer et annoncer la convergence entre les technologies d’analyse du contenu, de gestion de l’information et de structuration de données.

Le Web3.0 peut être considéré comme un réajustement, puisqu’il consiste à intégrer à la version précédente la structuration fournie par le Web sémantique, et notamment les ontologies. Ces outils permettent de structurer le foisonnement de connaissances ambiantes sur Internet afin de les mieux utiliser. Alors que le web1.0 a fourni des outils de structuration et de partage des documents, le Web 3.0 permettra, selon les analystes, de structurer et partager les connaissances, et offre ainsi à l’ECM des moyens de structutation de référentiel documentaire nouvelles.

Cette évolution repose sur deux grandes technologies déjà à l’œuvre dans différents projets industriels : d’une part, la capacité à structurer la connaissance et, d’autre part, la capacité d’extraire et exploiter ces données, et celles contenues dans le document.

Techniquement, ces évolutions reposent, pour partie, sur des outils de représentation et d’analyse linguistique et sémantique désormais au stade industriel.

Le Web4.0, quant à lui, fait le pari d’une plus grande autonomie des systèmes d’information pour la gestion de la connaissance. Cette autonomie est rendue possible par une granularisation de l’information, par la prise en compte du temps et de l’espace et, surtout, par des plateformes et des modules capables d’un certain niveau de ‘compréhension’ et, surtout, de restitution d’information.

On le voit, ces convergences constituent aujourd’hui une réelle chance et un véritable enjeu. L’information non-structurée, partie intégrante du capital immatériel de l’entreprise, devient plus riche et multimédia et les capacités du système d’information à les valoriser continuent de progresser : maîtrise des processus métiers et du cycle de vie hérités de l’ECM, analyse et la structuration de l’information fournies par les technologies linguistiques et sémantiques.

Cette convergence, pour l’entreprise, consécrera l’ère de l’eXtended Content Management.

dimanche 9 mars 2008

Un après-midi au forum Documation

J'aurai le plaisir, avec mon ami Laurent Le Foll, d'animer une session lors du forum Documation.
Cette session s'organise autour du Livre Blanc sur la valorisation de l'information non-structurée que nous avons rédigé dans la cadre d'une coopération entre l'APIL, l'APROGED et le CIGREF.

Cette session sera essentiellement constituée de présentations de cas concrets.

Le lecteur trouvera plus d'informations sur cette session sur le site de l'APIL (www.apil.asso.fr).