Archives pour la catégorie Ecrit en français

Où cours-je ? Dans quel état j’erre ?

Petite explication concernant mon humble personne et le peu de messages de ma part depuis fin mai. Je suis papa depuis peu ! Donc, mon actualité est actuellement davantage tournée vers les couches et les biberons que vers le Web Sémantique. Mon rythme de vie se stabilise progressivement à nouveau. Dans le nouvel équilibre que j’aurais trouvé, je compte aménager un espace de choix pour mon activité de carnetier. Mais bon, on verra bien si j’y arrive ! C’est le challenge du moment. A suivre…

Loi de distribution des noms au Vietnam

Certes, 54% des vietnamiens ont « Nguyen » comme nom de famille. Mais cela ne suffit pas pour modéliser la loi de distribution des noms de famille au Vietnam et encore moins celle des prénoms. Pourtant, un tel modèle permet de prédire les probabilités de collisions signalétiques (homonymies) dans l’annuaire des employés d’une multinationale. Et le vietnam a cela d’intéressant qu’il s’agit sans doute de l’un des pays dans lesquels les probabilités de collisions signalétiques doivent être les plus importantes (puisque 54%…).

Voici quelques sources générales sur le sujet :

un retour d’expérience utile pour comprendre les conventions de nommage en usage au Vietnam (document déjà cité dans un message précédent), voir également cette autre explication ou cette présentation plus générale des conventions de nommage à travers le monde en complément de mon ancien message à ce sujet
une longue liste de prénoms vietnamiens masculins, féminins ou unisexes (mais sans indication de fréquence d’occurence), à comparer avec des listes similaires trouvées ailleurs
un rapport d’étude trop succinct sur la base du système de la sécurité sociale américaine, qui mentionne le pays de naissance et donne la liste, par ordre décroissant de fréquence, des noms de famille des américains nés au Vietnam (entre autres)
enfin, quelques données statistiques sur le noms de famille et le nom intercalaire, réunies par Patrick Fermi mais malheureusement trop peu de choses sur les prénoms

Alors que faire ? Je crois bien que je vais me résoudre à compter les vietnamiens un par un. Enfin presque… J’ai trouvé un annuaire téléphonique du Vietnam, en ligne. Il ne reste plus qu’à apprendre à Excel à aller taper dedans, à compter les fréquences d’apparition des noms de famille et des prénoms (ce qui suppose d’ailleurs de différencier les noms de familles, les noms intercalaires et les prénoms composés…). Le résultat devrait être intéressant. Je vous en dirai plus à l’occasion.

Tant que j’y suis, même si c’est hors sujet, voici un excellent argumentaire qui explique aux américains pourquoi il est stupide de croire que les noms des gens peuvent toujours se décomposer en « First Name », « Middle Name » et « Last Name ».

Maturité des technos XML

01 Informatique a publié un état de l’art très synthétique au sujet des technologies XML. Chaque technologie présentée est qualifiée selon son degré de maturité. Et les seules technologies XML à avoir atteint le degré de maturité maximal sont les suivantes :

Les techniques de base : DOM, Unicode, XML, XML Namespaces, XLink, SAX, XML Schema/DTD, XLM Encryption, XML Signature, XPath 1.0, XSL et XSLT
La publication multicanal : CSS, VoiceXML, SMIL, SVG, XHTML, WML, MathML
Les services Web : le style REST, DSML (je ne suis pas sûr que la place de DSML soit vraiment dans la catégorie « services Web » mais enfin bon… pourquoi pas ?) et XML-RPC
Les échanges électroniques (B2B) : ICE
Le web sémantique : Dublin Core, RSS 1.0, RDF

Autrement dit, si vous envisagez d’appuyer une architecture informatique sur une technologie XML qui n’est pas dans cette liste, sachez que vous faites un choix technologique risqué car non éprouvé ! A vos risques et périls…

Clever Age – Le point sur l’interopérabilité J2EE, .NET et PHP

Clever Age a publié dans sa newsletter une excellente et didactique synthèse sur l’interopérabilité J2EE, .NET et PHP. J’en retiens les leçons suivantes :

Pour l’intéropérabilité, le couplage lâche c’est LE principe qu’il faut adopter
Les services web basés sur la pile de technologies liées à SOAP, c’est pas mal pour faire du couplage lâche
Mais les services web basés sur la technologie XML-RPC ou les services Web de style REST (quelle que soit la techno utilisée), c’est encore mieux car
1. plus simple
2. une pratique plus répandue
3. ça apporte moins de contraintes techniques inutiles (infrastructure, compétences, …)

J’ajouterais que les services Web de style REST offrent un couplage non seulement encore plus lâche (modularité du S.I.) mais également encore plus tardif : inutile, au moment de la conception de vos services Web, de faire des hypothèses sur l’usage qui en sera fait dans le futur, le style REST vous garantit leur intégrabilité future.

La différence essentielle entre le style REST et le style RPC (XML-RPC ou pile SOAP), c’est que le style REST permet l’intégration spontanée (non planifiée centralement) de services alors que la pile SOAP suppose une planification plus centralisée des projets d’intégrations de services à travers la négociation et la spécification de contrats entre fournisseurs et consommateurs de services (et qui dit contrat dit « une certe forme de codification » et donc une certaine perte de flexibilité pour le futur).

Ma conclusion : l’approche REST est plus adaptée aux organisations qui sont elles-mêmes faiblement couplées. Autrement dit : pour faire du SOA sur SOAP, il faut réunir toutes les parties prenantes et établir des contrats de services spécifiques et peu évolutifs ; conséquence : faites du SOAP dans une organisation non centralisée et vous vous retrouverez dans une situation similaire à celle dont se lamentait Reinout Van Rees, une situation qui conduit à l’échec ou au moins au gaspillage d’efforts. Posez-vous plutôt la question :

Vous vivez dans une cathédrale ? Alors vous pouvez vous contenter du couplage relativement faible offert par SOAP mais vous vous encombrez toute de même de contraintes inutiles
Vous vivez dans un bazar (« bordel organisé » disait Fred ?) ? Alors il vous faut du couplage extrêmement lâche et tardif. Et l’interopérabilité des composants du bazar passe alors par la simplicité et le caractère « future-proof » de REST.

Au bout d’un moment, j’ai l’impression de me répéter à force de ressasser les mêmes choses sur REST. Mais j’espère que d’un billet à l’autre, mes idées sur le sujet gagnent en clarté (au moins dans ma tête). Et les vôtres ?

Réseaux d’entrepreneurs

Ces jours-ci, l’actualité des carnets Web offre de manière involontaire une confrontation amusante : d’une part le point de vue de Dave Pollard sur l’importance des réseaux d’entrepreneurs pour « éviter les champs de mine » que doit traverser toute petite entreprise pour survivre et prospérer et d’autre part la mise à jour 2004 d’un outil de cartographie des relations entre les conseils d’administration des plus grosses sociétés américaines (NB : societe.com offre un service similaire pour parcourir les relations entre dirigeants de sociétés françaises, mais avec une interface moins sympathique à mon goût).

Ma conclusion suite à cette confrontation : à toutes les échelles, les réseaux de dirigeants ont une importance indéniable du point de vue économique. Mais y a-t-il des différences fondamentales entre des réseaux d’entrepreneurs (de PME) et des réseaux d’administrateurs (de multinationales) ? Pourquoi les réseaux d’entrepreneurs paraissent-ils de manière naïve plus « sympathiques » que les réseaux d’administrateurs de grandes entreprises qui inspireraient plutôt la méfiance de l’opinion publique ? Cette différence de perception n’est-elle pas simplement idiote ? Ou bien les réseaux d’entrepreneurs seraient plus ouverts (accessibles et à jeu gagnant-gagnant comme on dit) alors que les réseaux d’administrateurs seraient plus fermés (secrets pour protéger la mise d’un jeu à somme nulle) ?

Management et stratégie des OSBL

Pour faire suite à mon billet de mars sur le management associatif et pour fournir plus d’information sur ce sujet, comme cela me l’a été demandé, voici, ci-après, quelques notes que je retiens de la lecture d’un document de Jean-François Pépin au sujet du management et de la stratégie des organisations sans but lucratif.

Les OSBL devraient être managées comme des entreprises ? Pourtant, elles en diffèrent en trois points, facteurs de complexité (au sens noble du terme) :

l’évaluation de leur performance n’est pas seulement comptable ou financière mais surtout sociale (cf. le concept de développement durable…)
leurs ressources humaines sont salariées mais aussi bénévoles
leur action a une finalité politique ou sociale (« créer du lien », …)

Leur fonctionnement s’appuie sur une « économie sociale de marché » : fonctionnement démocratique, volontariat, ni rémunération du capital ni distribution de bénéfices, faculté de délibération, … La logique d’économie de marché augmente la valeur (qualité / coût) des processus métiers (prestations de services…) des OSBL.

La mise au point d’une stratégie pour une OSBL suppose de répondre à des questions essentielles telles que « de quel type de rentabilité sommes-nous redevable et envers qui ? », « comment prendre en compte tous les points de vue dans nos décisions ? », … Une telle stratégie suppose de distinguer l’important (l’organisation, la survie économique) de l’essentiel (le projet associatif).

La clef du succès réside dans l’équilibre dynamique entre administrateurs bénévoles et permanents salariés et dans la vision partagée qui doit en résulter.

A noter que, pour le plaisir du lecteur averti, J.-F. Pépin renforce même son exposé d’une citation de Pierre Lévy pour rappeler que la clef de la performance dans un environnement aussi complexe réside dans les processus organisationnels que le philosophe qualifie d’intelligence collective.

Pourquoi Jonas plutôt que JBoss

Voici une liste d’arguments de comparaison entre deux serveurs d’applications J2EE open source : JBoss et Jonas. Je trouve cette liste intéressante car elle pointe les problématiques qui me semblent les plus importantes pour un projet d’entreprise autour d’un produit open source : disponibilité du support, de la documentation, etc. Selon moi, pour le lecteur, cette argumentation devrait être plus importante que le choix lui-même.

Merci, Thomas, de m’avoir indiqué ce lien !

Decentralized organizations centralizing their IT architecture = 0,1% chance of success

Reinout van Rees says

I’ve had enough of all those pictures in powerpoint presentations showing the One Central Database Or Application that would solve all communication problems in a building project.

Is this a coincidence if I feel the same and I work in a similar industry ? It is a hard job to convince this industry of the benefits of spontaneous integration and the adequacy of the open source model to support it ! Come on Reinout, let’s build the Spontaneously Integrated Front of Really Loosely Coupled Architects for the Building Industry ! ;-) Need to find a better name : SIFRLCABI does not sound well enough, even in French or in Dutch.

Reinout’s ROPE

Good news ahead : Reinout van Rees has recentrly restarted struggling with his ROPE project. I had just been thinking about the current status of this project this weekend. I hope there will soon be some nice RDF support within Zope. And ROPE is made for this since ROPE = Rdflib + zOPE.

Ingeniweb réinvente RSS

Le Zope Service Provider Ingeniweb publie RSSSearch, un nouveau composant pour Plone qui tranforsme la fonctionnalité de recherche de Plone en méta-moteur de recherche : les résultats affichés proviennent non seulement du site interrogé mais également de plusieurs sites distants. OK.

Ce qui est amusant, c’est qu’au passage Ingeniweb invente encore une nouvelle signification pour l’acronyme RSS. En effet, à l’origine, RSS signifiait Rich Site Summary puis certains l’ont renommé Really Simple Syndication et d’autres RDF Site Summary. Et voila qu’Ingeniweb ajoute sa sauce : Research Support System ! Décidément, chacun invente son RSS. Mmm… Est-ce une blague ?

Présentation du Web Sémantique

Voici une esquisse de plan de présentation des technologies du Web Sémantique pour un public (francophone) d’informaticiens de grandes entreprises :

Théorie et spécifications
- RDF, le modèle : sujet-prédicat-objet, importance des URIs
- RDF, les syntaxes : XML Schema, ne pas s’attacher à la syntaxe mais davantage au modèle
- RDFS, le schéma
- OWL (voir aussi ici): ses trois niveaux
- Parallèle entre RDF/RDFS/OWL et UML : modélisation d’ontologies vs. diagramme de classes
Le Web Sémantique (grand W, grand S) :
- La pile de technos du Web Sémantique
- La vision de Tim Berners-Lee
- Parallèle entre le Web et le Web Sémantique : humains vs. machines, liens hypertextes vs. relations sémantiques
Le web sémantique (petit w, petit s) : applications concrètes
- l’Open Directory : un précurseur dans l’écosystème des annuaires de contenu
- Dublin Core : l’intégration de méta-données documentaires
- RSS : la boucle weblogs + syndication + aggrégation, l’écosystème RSS
- Calendriers : iCal d’Apple, précurseur suivi par eventSherpa
- FOAF : la boucle site perso + syndication FOAF + analyse de réseaux sociaux, l’écosystème FOAF
Les prochaines étapes de déploiement du web sémantique
- 3 sources de valeur pour le web sémantique, notamment grâce à l’ouverture de ses standards
  1. créer un écosystème de méta-données par schéma = par niche (RSS, FOAF, …)
  2. pérenniser les connaissances/faciliter la reprise de données
  3. créer des applications agnostiques en matière de données ! pour unifier les écosystèmes sémantiques de niche
- Débouchés fonctionnels des frameworks du web sémantique
  - Créer des composants d’interface faisant abstraction des données traitées : l’exemple du support de RDF par le framework Mozilla ; le Personal Information Management façon Chandler ; les Wiki Sémantiques
  - Etendre au runtime le schéma d’une base de données relationnelle d’une application
  - Etendre au runtime le schéma d’une application de gestion de contenus/gestion de connaissance : le schéma devient une donnée comme les autres ; pour faire un annuaire de connaissances extensible /un livre de connaissances extensible / une application de gestion de contenu avancée ; exemples du moteur Archetypes du framework CMF pour Plone, du composant CPSSchemas de CPS, du moteur de gestion de fiches de Sharing Knowledge, du moteur de gestion de topic maps de Mondeca, du moteur de gestion d’ontologies d’AM2 Systems ; possibilité d’intégration de schémas et de contenu provenant de sources tierces
  - Intégrer des taxonomies pour produire des reporting consolidés à partir de sources hétérogènes (« business intelligence ») et fluidifier la gestion de contenus (intégration d’informations sémantiques, plus généralement)
  - Intégrer les référentiels d’entreprise (E.I.I.) grâce à un moteur à base de règles ; utilisation en B2B ; parallèle avec l’approche « méta-annuaires » (moteurs de jointure)
  - Aider à la décision grâce à un moteur d’inférence (systèmes experts appliqués à l’informatique décisionnelle)
  - « Orchestrer » les processus métiers et les services Web (Business Process Management et workflows) grâce à un moteur à bases de règles ; exemple d’AM2 Systems
  - le « Google du futur » : moteurs de recherche à base d’ontologies ; filtrage collaboratif ; parallèle avec les moteurs à base de thésaurus (cf. la problématique de la modélisation)
  - Assistants intelligents : exemple de l’agent organisateur de rendez-vous
  - Rêves d’Intelligence Artificielle…
  - … et d’intelligence collective !
Les problématiques du web sémantique
- Faire le partage entre ce qui est fantasme visionnaire (W.S.) et ce qui est technologie productive (w.s.)
- Expliquer la différence entre XML et RDF
- Préparer les entreprises à traiter une problématique peu abordée par les éditeurs logiciels et donc peu promue (car peu vendeuse de licences logicielles ?)
- Quels outils pour le développeur ? (exemple)
- Des métadonnées : « Mais qui va faire l’annotation ?! », l’écosystème n’est viable que si la méta-donnée est un sous-produit de l’application (i.e. si l’utilisateur a un réel besoin d’annoter)
- La poule et l’oeuf : pour faire émerger un écosystème de niche par où commencer ? la production de méta-données ? leur aggrégation ? leur exploitation ?
- Comment et quand créer un modèle ?
  - Avec des outils de gestion d’ontologie comme Protege ou autres
  - Modélisation top down (ontologie centrale créée par un « comité métier ») vs. bottom up (équivalences créées a posterio entre ontologies locales) ; les deux tactiques sont acceptables ; les technos supportent aussi bien les deux approches sans aucun problème (et notamment l’approche bottom up = organique) ; c’est une question politique et non technique ; dans tous les cas, cela relève d’une activité nouvelle et spécifique : l’Information Architecture (attention aux dérives démoniaques du web sémantique ;-) )
- Comment rentabiliser le coût d’une infrastructure d’agrégation de méta-données ?
- Le web sémantique est de style architectural REST ; les services web de style RPC reposent sur un contrat à établir a priori alors que l’intégration de services web sémantiques peut se faire a posteriori (attendez-vous à de l’intégration spontanée !)

Active Directory : mono- ou multi-forêt(s) ?

Cet article évoque

research that shows that early adopters of Active Directory tended to choose fewer forests than was ideal, and their networks suffered for it.

Alors, que faut-il penser des grandes entreprises qui choisissent un modèle centralisateur mono-forêt qui centralise, du même coup, le pouvoir de gestion de l’informatique (est-ce une finalité du projet ?). Mmm… Et vous, mono- ou multi-forêt ?

Pourquoi la ville est chaude ? Parce qu’elle est sombre !

On sait qu’au voisinage des grandes agglomérations, la température moyenne est toujours un peu plus élevée que la moyenne régionale. On impute habituellement ce phénomène à l’excès de gaz carbonique produit en ville, qui crééerait un micro-climat du à un micro effet de serre. Mais ne serait-ce pas plutôt, simplement, parce que les toits de nos maisons ainsi que le goudron de nos routes et trottoirs sont trop sombres et ne reflètent ainsi pas assez la chaleur ?

Experimental programs to build some treemaps from graphs

Here is the zipfile containing the treemap programs I mentioned earlier.
And these are zipped set of screenshots produced by these programs : « typic » screenshots, smoothed « typic » screenshots, the « try » graph screenshots, the smoothed « try » graph screenshots. Each set of screenshots corresponds to a specific graph. The « typic » graph is made with 8 nodes grouped in two tightly linked subsets (A-B-C-D and E-F-G-H). The « smoothed typic » graph is the typic graph once the weights of the arcs have been smoothed by a specific smoothing algorithm (ask if you want to know more). The « try » graph is another simple graph with nodes representing some concepts related to me (« family », « video », …) and linked one with another according to their analogy. And the « smoothed try » graph is… guess what.

Treemaps

Here
is some bloggy information about treemaps. Treemaps are cool when you want to visualize a weighted tree such as the tree of folders and files on your hard drive weighted according to their size. An excellent free utility to visualize your disk space occupation is Sequoia View.

Beyond Sequoia View, why such an interest from me for treemaps ? Well… Because I just realized I sort of reinvented and explored this concept several years ago without knowing the proper term. Treemaps… My experiments dealt with the use of treemaps for the visualization of graphs of information (networks composed with nodes and arcs).

For instance, let’s take the following graph composed with 8 nodes labelled from A to H. a typic graph with 8 nodes

When you « sit » on node A and try to look through the arcs to the rest of the graph, what can you see ? Answer : the treemap below. (each node is associated to a specific color)
the classic treemap of the typic graph

What if you consider that the whole space (rectangle) of a given node should be separated in subrectangles for the associated nodes ? Then your treemap becomes somewhat fractal and you get this kind of visualization for the same 8 nodes graph seen from node A :
the treemap of the typic graph

Or maybe you prefer the circle version of this treemap which may look more readable. Here it is with a limited depth (exploring no more than 3 arcs from the starting node) :
circle version of the treemap for the typic graph
But it looks even nicer if you explore a high number of arcs :
hi-depth version of the circle treemap

I will soon post the programs that produce these treemaps and some more screenshots.

Des carnets Web au web sémantique

Sebastien Paquet évoque l’évolution future des carnets Web et l’émergence du « structured blogging ». L’idée est la suivante : plus l’activité des carnettiers va gagner en maturité, plus le format habituel des carnets et de RSS (titre + URL + texte) paraîtra limité et insuffisant, plus les outils de la chaîne de carnettage (weblog + aggrégateurs) vont prendre en compte des types de contenu structurés plus complexes. Et il n’y a qu’un pas (voire aucun) entre le « structured blogging » et le web sémantique. Dans ce contexte, les moteurs de gestion de schéma de contenu tels que Archetypes de Plone (ou CPSSchema de CPS ou encore des moteurs de gestion d’ontologie tels que Mondeca et autres AM2 Systems) auront un rôle clef à jouer puisque des plate-formes équipées de tels moteurs pourront servir au carnettage structuré sous toutes ses formes !

Miam, miam, les années qui viennent nous promettent des inventions fichtrement intéressantes ! Et la vision du Web Sémantique commence à prendre forme.

Instantanée de la presse grâce à Google

Via Constellation W3 : cette superbe interface cartographique permet de visualiser en un seul coup d’oeil les grands thèmes de l’actualité selon Google et notamment leur importance relative (d’après leur citation dans un nombre plus ou moins grand de sources de presse). L’utilisateur peut sélectionner les pays surveillés ainsi que les thèmes et le moment de la surveillance (maintenant en temps réel ou bien hier matin ou bien jeudi dernier vers midi, etc.). L’utilisateur peut ensuite garder un permalien vers sa sélection pour y revenir à l’avenir. Exemple : le lien ci-dessus pointe vers les actualités présentes pour la France dans les thèmes « Monde », « Nation », « Entreprises » et « Technologie ».

Carnets Web d’entreprise : l’exemple R.H.

Ce carnet Web tenu à jour par deux responsables R.H. en recrutement, de chez Microsoft, est un très bon exemple de carnet Web d’entreprise. Ce qu’apportent ces carnets à Microsoft : un lien d’animation avec la communautés des candidats à l’embauche chez Microsoft, une manière d’optimiser le processus de recrutement (les candidats postulent en étant tous mieux préparés), une meilleure lisibilité de la politique d’embauche de Microsoft, l’image d’une entreprise à visage humain. Il y a sans doute d’autres avantages fournis par les carnets Web pour soutenir la fonction R.H. de recrutement des grandes entreprises. Je vous laisse imaginer (et laisser vos idées éventuelles ici pour que tout le monde en profite !).

La différence entre « knowledge management » et « content management »

CMSWatch signale un excellent article qui parvient en quelques lignes non seulement à définir la différence entre gestion des connaissances et gestion de contenu mais également à résumer de manière très juste les pratiques actuelles dans ces deux domaines.

Mon intérêt personnel réside certes dans le domaine de la gestion des connaissances au sens large présenté dans cet article, mais le vrai potentiel de ce domaine me semble résider dans les pratiques (méthodes) et outils (émergents) d’ingénierie des connaissances. D’où mon intérêt pour le Web Sémantique…

Définition démoniaque du Web Sémantique

Danny Ayers signale une définition démoniaque de ce qu’est le Web Sémantique. Je cherchais justement une définition simple à retenir en vue d’une présentation à des collègues… Sataniquement parlant, le W.S. est donc : « une tentative d’application du système décimal de Dewey à une orgie. »

Jean Millerat's bytes for good

Innover, Servir, Entreprendre !