LocoTrain
cn de en fr es it jp nl pt sv no
web
web - news - images - annuaire - compagnies + en plus

recherche avancée
Cache
images
Cache

Voici la version LocoTrain de la page mise en cache http://www.inria.fr/valorisation/standardisation/web/index.fr.html le April 12 2015 23:11:07.
La version « Cache » proposée par LocoTrain correspond au texte de la page lorsque le robot de LocoTrain l'a consultée.
En aucun cas LocoTrain est affilié au contenu textuel ci - dessous.

inria - standardisation : technologies de réseaux sans fil      protocoles | sécurité et mobilité | liaisons satellitaires | diffusion de groupe | réseaux sans fil | web | langues naturelles | ergonomie des logiciels | nouveaux usages | calcul scientifique | algorithmes | cartes à puce | pas de web sans normalisation  logiciel d'actualité -  multimédia -  quand les ordinateurs ... - moteurs de recherche -  l'inria plusieurs projets de recherche de l'inria développent des langages pour améliorer la conception et la manipulation des documents du web non seulement en terme de structure mais aussi de sens, pour créer ce qu'on appelle le web sémantique. ces travaux sont menés dans le cadre du consortium international de recommandation w3c. lorsque le web s'est déployé, le problème de la représentation des pages s'est rapidement posé. une norme sur le sujet, sgml, avait été publiée par l'iso (organisation internationale de normalisation) en 1986. c'était un premier pas vers une approche structurée des documents, une organisation logique, explicite en chapitres, sections, sous-sections… qui permet des traitements sur le contenu des documents, comme des recherches par mots-clés, un déplacement facilité dans le document… les chercheurs du projet de recherche wam de l'inria rhône-alpes travaillaient sur ces représentations logiques de documents depuis une dizaine d'années. ils ont donc été naturellement impliqués dans les réflexions menées sur le format de représentation des pages web. pour expérimenter ces formats, ils avaient développé un prototype logiciel. " lorsque le consortium w3c (world wide web consortium, qui développe les standards du web) s'est monté en 1994, raconte vincent quint, responsable du projet wam, il a été de suite intéressé par notre logiciel : le w3c avait besoin d'un tel outil pour valider, expérimenter et démontrer les nouvelles technologies du web, en particulier du point de vue des utilisateurs, qu'ils produisent ou utilisent des documents. " un logiciel toujours au goût du jour deux membres de l'équipe ont donc rejoint l'équipe technique du w3c (cf. l'inria, acteur majeur du w3c ) pour continuer le développement de ce logiciel, baptisé amaya. amaya a ainsi progressivement intégré les nouvelles recommandations créées par le w3c. au fil du temps, le logiciel a évolué vers un outil " auteur " opérationnel, qui permet non seulement d'utiliser les technologies les plus récentes du web mais aussi de produire des pages web complexes contenant du texte, des graphiques ou des expressions mathématiques, respectant les recommandations du w3c. depuis fin 2004, une toute nouvelle version de cet éditeur web est disponible. l'inria a aussi largement contribué à développer certains de ces nouveaux formalismes, comme mathml qui est la recommandation du w3c pour représenter les mathématiques dans des documents xml, nouveau format de représentation des pages web, successeur de html. il permet aux enseignants, aux étudiants, aux chercheurs, aux ingénieurs de mettre des mathématiques dans leurs pages web et de les échanger par e-mail ou d'un logiciel à un autre. mathml est le résultat d'un groupe de travail créé en 1997 par le w3c. des chercheurs du projet de recherche cafe y ont d'emblée participé. dans les années 1990, ils avaient déjà développé avec d'autres instituts de recherche, un standard dans ce domaine baptisé openmath (qui utilisait sgml). mathml permet d'ailleurs d'utiliser openmath pour décrire des objets mathématiques plus complexes que ceux représentés nativement dans mathml. la première recommandation mathml a été émise en 1999. la seconde version date de 2003. un certain nombre de documents utilisent déjà mathml (comme les brevets américains, du us patents and trademarks office) et les grands éditeurs scientifiques comme elsevier ou springer, ou des éditeurs de cours en ligne s'y intéressent et l'utiliseront lorsqu'ils encoderont leurs documents en xml. le casse-tête du multimédia autre sujet de préoccupation qui a rapidement pris une ampleur considérable sur le web : le développement du multimédia, qu'il soit statique comme des images ou du texte ou dynamique comme la vidéo ou le son. il fallait s'assurer que tous ces documents restent exploitables dans des environnements aussi hétérogènes qu'un ordinateur, un téléphone portable ou un téléviseur. plusieurs groupes de travail ont été mis en place au w3c pour réfléchir à des solutions. un chercheur du projet de recherche wam, nabil layaïda, travaille depuis plusieurs années dans l'un d'entre eux, " multimédia synchrone ", créé début 1997 pour adapter les documents multimédia au web, définir les relations temporelles entre les différents éléments d'informations d'un document, prévoir comment le son, l'image ou la vidéo vont s'assembler à la fois dans l'espace de l'écran et dans le temps. ce groupe de travail développe un langage baptisé smil, auquel les chercheurs de l'inria ont largement contribué, en particulier par le biais des concepts développés par nabil layaïda au cours de sa thèse. une première version de smil a été recommandée par le w3c en juin 1998, une seconde en août 2001. la version 2.1 est validée depuis mai 2005. le format est déjà largement utilisé : par exemple par le logiciel realplayer ou pour les messages multimédia mms, successeurs des sms avec une version adaptée pour les téléphones mobiles. nabil layaïda a par ailleurs coordonné le développement de logiciels implémentant smil. depuis l'été 2004, un de ces outils web, baptisé limsee, est disponible. il permet de créer des présentations multimédia adaptables, au format smil. un autre, baptisé pocketsmil, est dédié aux assistants personnels et appareils mobiles. dans le même esprit, le w3c a créé un groupe de travail, " device independance ", dont le but est de faire en sorte que le web soit indépendant des appareils par lesquels on y accède. un doctorant du projet wam, tayeb lemlouma, a participé à ses travaux jusqu'en 2004. les recherches concernent par exemple la transformation et l'adaptation d'un document multimédia comportant vidéo, son et texte à un téléphone portable. les solutions consistent par exemple à remplacer la vidéo par des images statiques ou à restructurer les documents pour les faire apparaître de façon séquentielle. quand les ordinateurs raisonneront… néanmoins, au delà de ces besoins de structuration des documents, de traitement des données, il faut aussi faire face au déluge d'informations du web. pour cela, une des solutions, envisagée par le w3c depuis la fin des années 1990, ambitionne de rendre le contenu des documents plus intelligible, de donner du sens aux informations stockées dans les pages web en html. on appelle cela le web sémantique. la standardisation en xml fait alors figure de première étape : elle définit la syntaxe de structure des documents et des données. pour accéder au sens, les langages du web sémantique permettent ensuite d'organiser, de hiérarchiser les concepts utilisés pour décrire les ressources du web dans des ontologies, des structures logiques capturant un certain nombre de relations entre ces concepts. ces langages permettent, par exemple, de déduire que si 'un train nécessite un billet' et que 'le tgv est un train', alors 'le tgv nécessite un billet'. les ontologies organisent les descriptions des concepts (comme 'billet' ou 'train'). dès lors, des tâches telles que la recherche d'informations (par exemple pour l'organisation d'un voyage impliquant avion, train et hôtel pour une destination donnée) peuvent être menées intelligemment par les ordinateurs eux-mêmes, sur plusieurs sites à la fois et indépendamment du format des données. le web sémantique permet en fait aux ordinateurs de raisonner, d'associer des concepts voisins pour une requête donnée, chose impossible avec la plupart des moteurs de recherche actuels : les réponses seront plus précises et plus pertinentes. le premier langage du web sémantique, baptisé rdf (ressource description framework), a été recommandé par le w3c en 1999 et en 2004, suivi de rdf schema, recommandé en 2004. rdf permet des descriptions sémantiques simples et rdf schema fournit un vocabulaire de base pour décrire le sens des concepts utilisés. deux projets de recherche de l'inria sont particulièrement impliqués dans les travaux sur le web sémantique : acacia à sophia-antipolis et exmo à grenoble. depuis 2001, les chercheurs du projet de recherche exmo qui travaillaient sur la conception de langages de représentation de connaissances ont naturellement contribué au groupe de travail " webont " du w3c destiné à développer un troisième langage sémantique, plus expressif que rdf schema : baptisé owl et recommandé en février 2004, c'est le premier langage qui permet de définir des ontologies. plusieurs logiciels utilisant owl sont en cours de développement. des systèmes opérationnels sont produits par hewlett packard et les universités de manchester et karlsruhe. des premières applications aux moteurs de recherche de demain ces langages, en particulier rdf et rdf schema, commencent à être utilisés. la principale application mondiale s'appelle foaf (friend of a friend). elle a été créée pour connecter les gens entre eux, former des réseaux de connaissances, des partenariats : chacun décrit son profil (nom, e-mail, centres d'intérêt, activité professionnelle…) et l'ordinateur fait le reste. le web sémantique intéresse aussi les entreprises pour la gestion de leurs connaissances. pour assurer un bon développement des langages rdf et owl, le w3c a lancé en 2004 un groupe de travail pour définir les " meilleures pratiques du web sémantique ", pour expliquer les langages, donner des éléments méthodologiques, répondre à des problèmes d'utilisation et fournir du matériel pédagogique. fabien gandon, chercheur du projet de recherche acacia, y participe. le projet acacia s'intéresse aux méthodes et aux outils pour la gestion des connaissances. dans le but d'assurer l'interopérabilité entre différentes solutions, leurs travaux s'inscrivent aussi dans le cadre du web sémantique. une plate-forme baptisée corese, développée depuis 1999 permet de concevoir des serveurs dédiés au web sémantique : ils sont basés sur un moteur de recherche exploitant les descriptions du contenu sémantique des documents. corese implémente un traducteur qui permet de lire et produire des descriptions en rdf en les interprétant dans le formalisme des graphes conceptuels, une méthode de représentation de connaissances et de raisonnement qui bénéficie de 20 ans de recherches. la plate-forme corese est disponible sur le web. enfin, pour que le web sémantique soit réellement opérationnel, en particulier pour des moteurs de recherche, il faut également concevoir des langages de requêtes pour rdf et owl, par exemple pour exploiter simultanément deux ontologies différentes et assurer leur interopérabilité. un groupe de travail du w3c, " rdf data access group ", y est dédié, auquel des chercheurs du projet exmo participent. c'est dans cet esprit qu'olivier corby, chercheur du projet acacia, évalue les performances du langage de requête qu'il a conçu pour la plate-forme corese. l'inria, acteur majeur du w3c l'inria a été un des trois piliers du w3c (world wide web consortium), consortium international qui assure l'évolution et la promotion des standards du web. l'institut a été le premier site hôte européen, de 1995 à 2002 aux côtés du mit (massachusetts institute of technology) pour le continent américain et l'université de keio au japon pour l'asie. depuis 2003, l'ercim (groupement européen de recherche en informatique et en mathématiques) a pris le relais de l'inria pour l'europe. pendant ces 8 années, une vingtaine de personnes de l'inria participait à l'équipe technique du w3c (qui en comptait une soixantaine). jean-françois abramatic a d'ailleurs présidé le consortium pendant 4 ans jusqu'en 2001. vincent quint a été en charge d'un des quatre domaines techniques du w3c sur les formats de documents utilisés sur le web et les interfaces avec les utilisateurs. " c'était avant tout un rôle d'animation, explique-t-il. cela consistait à être à l'écoute des besoins, à coordonner les efforts, proposer la création de groupe de travail et assurer la participation des chercheurs et industriels. " aujourd'hui, 6 ou 7 chercheurs de l'inria participent à des groupes de travail. vincent quint, directeur de recherche à l'inria, est co-animateur du "technical architecture group" (tag) du w3c depuis le 1er février 2005. | début de la page    |suite traitement informatique des langues    | page d'accueil du site © inria - mise à jour le 29.08.2006 - dri-webmaster@inria.fr
Retour aux résultats
LocoTrain est un site internet du groupe Web Trains : annonceurs - charte - copyright - droits juridiques/CNIL/Statistiques - presse - email. Toute reproduction est interdite sans autorisation de LocoTrain.