Novembre 2008 i-mag

36
42 i-mag i-mag Magazine de l’AAE ENSIMAG Novembre 2008

Transcript of Novembre 2008 i-mag

Page 1: Novembre 2008 i-mag

42

i-magi-magMagazine de l’AAE ENSIMAG

Novembre 2008

Page 2: Novembre 2008 i-mag
Page 3: Novembre 2008 i-mag
Page 4: Novembre 2008 i-mag
Page 5: Novembre 2008 i-mag

Jean-Marc DarrigolEnsimag 1988

Directeur Ingenierie au sein de Yahoo

L es plus anciennes rĂ©fĂ©rences aux interactions sociales quiseraient possibles avec un rĂ©seau d’ordinateurs datent de1962, et la premiĂšre dĂ©monstration publique du rĂ©seau

ARPANET a eu lieu en 1972. Mais c’est le dĂ©but des annĂ©es 90, avecla crĂ©ation au CERN des standards Ă  la base du web et l’apparitiondu navigateur Mosaic, qui marque le dĂ©but d’Internet tel que legrand public le connaĂźt. Web, courrier Ă©lectronique et messagerieinstantanĂ©e ont explosĂ© dans les deux derniĂšres dĂ©cennies et In-ternet est maintenant universel, omniprĂ©sent, global.

Impossible d’ĂȘtre exhaustifs devant un domaine aussi large, doncnous essayons seulement dans cette revue de donner au lecteurquelques pistes de rĂ©flexion.

RĂ©flexion sur la taille tout d’abord. Avec une croissance expo-nentielle du nombre de systĂšmes connectĂ©s, Internet oblige Ă  in-venter des moyens pour l’apprĂ©hender. C’est ce que Franck Ghi-talla nous explique dans son article sur la cartographie du web.Les mĂ©thodes de recherche doivent Ă©galement ĂȘtre revues, les motsclĂ©s ne permettant qu’un accĂšs partiel Ă  la masse d’informationexistante. Gilles Vandelle nous explique ainsi comment les rĂ©seauxsĂ©mantiques sont une piste pour amĂ©liorer la pertinence des re-cherches en ligne. CĂŽtĂ© infrastructures, les besoins sans cessecroissants rendent nĂ©cessaires la mise en place de technologies in-novantes, telles que le grid computing dont RĂ©my Amouroux nousexplique les principes.

RĂ©flexion sur les services ensuite. Internet a rĂ©volutionnĂ© notrefaçon de vivre en crĂ©ant de nouveaux services pour les utilisateursou en changeant des services existants. Nous avons sĂ©lectionnĂ©trois exemples pour l’illustrer : le vote par Internet, qui entremaintenant dans une phase de maturitĂ© (BenoĂźt Chenon), le crĂ©ditde particulier Ă  particulier, service qui est maintenant rendu pos-sible Ă  grande Ă©chelle (Marc Duleba) et enfin l’accĂšs aux informa-tions multi-sources (Pierre Chappaz). Trois gouttes d’eau dans unocĂ©an de sites et de services Ă©voluant sans cesse.

Pour complĂ©ter ces deux axes, Laurent Gatignol nous parle del’Internet sur mobile, qui participe Ă  cette universalitĂ© de l’accĂšsau rĂ©seau. Enfin, le besoin d’évolution rapide des sites dans un en-vironnement technique complexe et l’impact direct des modifica-tions sur les utilisateurs obligent les Ă©quipes de dĂ©veloppement Ă envisager de nouveaux processus. Dans ce contexte, les mĂ©thodesdites Agile sont pertinentes et trĂšs utilisĂ©es par les sociĂ©tĂ©s Inter-net, comme nous l’explique Alexandre Boutin.

Au final, cette revue effleure Ă  peine la surface de ce domaine,mais il faudrait une encyclopĂ©die pour en faire le tour, et celle-ciserait obsolĂšte Ă  peine Ă©crite. Des domaines entiers de l’économiesont seulement Ă  l’aube d’une rĂ©volution dont on a du mal Ă  me-surer les impacts. Je pense aux loisirs numĂ©riques et Ă  l’accĂšs auxproduits culturels par exemple. Nous sommes en prĂ©sence d’unmĂ©dia et d’un pan d’économie qui croissent de façon exponentielleet Ă©voluent sur des cycles d’une frĂ©quence inconnue jusque lĂ .Comment dans ce cas tirer des plans sur l’avenir ?

Je voudrais terminer en remerciant les auteurs qui m’ont faitl’amitiĂ© de participer Ă  cette revue, et en vous souhaitant unebonne lecture. ❃

I-MAG - NOVEMBRE 2008 3

Ă©Ă©ddiittoorriiaall

JJeeaann--MMaarrcc DDaarrrriiggooll

Ensimag 1988, est Directeur Ingenierie au sein de

Yahoo Ă  Echirolles. Il commence sa carriĂšre chez

Bull puis prend trùs tît le virage de l’Internet. Il

rejoint Kelkoo en mars 2000 comme responsable

des sites de marque blanche, avant de prendre la

direction de la R&D en 2004.

Page 6: Novembre 2008 i-mag
Page 7: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 5

ssoommmmaaiirree

EDITEDITORIALORIALPar Jean-Marc Darrigol 3

La Naissance d’une gĂ©ographiedu Web ? Par Franck Ghitalla 6

Utilisation des réseaux sémantiquesdans la recherche Web Par Gilles Vandelle 12

Web Services et Grid Computing :la nouvelle Úre des systÚmes distribuésPar Rémy Amouroux 14

Le vote par internet : quel avenir ?Par BenoĂźt Chenon 18

CrĂ©dit de particulier Ă  particulier.L’argent sans la banque ?Par Marc Duleba 20

Wikio, un portail d’information 2.0Par Pierre Chappaz 18

L’internet mobilePar Laurent Gatignol 26

L’agilitĂ© au Service du WebPar Alexandre Boutin 28

Vie de l'associationPar Mouna Beyk 31

Edition : i-mag est publiĂ© par l’Association des anciens Ă©lĂšves de l’ENSIMAG, 68, Bld de Port Royal 75005 Paris - TĂ©l.06 28 50 08 85; site : www.aae-ensimag.com ; e-mail : [email protected] ; rĂ©dacteur en chef : Jean-Marc Darrigol. PUBLICITE : Editions 50, 87, route de Grigny, 91130 RisOrangis. CONCEPTION GRAPHIQUE ET MAQUETTE : tĂ©l. 04 42 99 38 31. IMPRESSION : Imprimerie de Montligeon, 61400 La Chapelle Montligeon.DĂ©pĂŽt lĂ©gal : mai 2008 ; ISSN 1774-7104.

« A l’heure de l’internet global »

Photographie de couverture : © Nmedia - Fotolia.com

Page 8: Novembre 2008 i-mag
Page 9: Novembre 2008 i-mag

La naissance d’une gĂ©ographie du web ?

I-MAG - NOVEMBRE 2008 7

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Si l’on quitte quelques instants notrenavigateur-web et que l’on oublie leslistes Ă  plat que nous donnent lesmoteurs de recherche, alors s’ouvre ununivers oĂč les documents web et leursliens sont inextricablement mĂȘlĂ©s. Ilsforment un systĂšme complexe qui nesemble plus rien devoir Ă  l'organisa-tion physique des rĂ©seaux, se dĂ©ve-loppant de lui-mĂȘme au niveau le plusabstrait de toute cette sĂ©rie de couchesde machines et de protocoles qui for-ment l'Internet. L’activitĂ© de nombreuxchercheurs et ingĂ©nieurs, dans le sec-teur de la recherche acadĂ©miquecomme industrielle, est aujourd’huiconcentrĂ©e sur l’étude du web commearchitecture dont il s’agit de construireles modĂšles possibles en s’appuyantsur des donnĂ©es expĂ©rimentales oudes donnĂ©es indexĂ©es dans les grandesbases d’indexation des moteurs derecherche.A parcourir les publications issues duchamp des computer sciences et duweb-mining ces derniĂšres annĂ©es, onse rend compte combien les cher-cheurs et les ingĂ©nieurs contribuentpetit Ă  petit Ă  le dessiner comme unsystĂšme topologique complexe, esquis-sant Ă  diffĂ©rentes Ă©chelles et partouches successives son modĂšle Ă  lafois graphique et logique. C’est lĂ , dans

“Nous avons crĂ©Ă© le Web, et nous avons pour devoir de lecomprendre ". Ainsi s’est exprimĂ© Tim Berners-Lee le 10novembre 2006 en fondant le W.S.R.I. (Web Science Re-search Initiative). Cette initiative rĂ©cente du M.I.T. et del’universitĂ© de Southampton de promouvoir l’émergenced’une “science du web” montre, si besoin Ă©tait, tout le che-min qu’il reste Ă  parcourir pour comprendre ce rĂ©seaudont la raison nous Ă©chappe encore. Le web reprĂ©sente eneffet un « e-cosystem » (1) documentaire relativement in-Ă©dit. Certains principes de son organisation sont encoremal connus, mĂȘme si depuis quelques annĂ©es on com-mence Ă  percevoir certaines propriĂ©tĂ©s gĂ©nĂ©riques de cetespace hypertexte ouvert et dynamique.

Par Franck GhitallaMaĂźtre de ConfĂ©rences en Sciences de l’Information - PrĂ©sident de l’association de recherche WebAtlas

FFrraanncckk GGhhiittaallllaa

MaĂźtre de ConfĂ©rences en Sciences de l’Information Ă  l’UniversitĂ© de Technologie de CompiĂšgne depuis 1999.

PrĂ©sident de l’association de recherche loi-1901 WebAtlas - Consultant en management de l’information

TThhÚÚmmeess ddee rreecchheerrcchhee ::

technologies web, cartographies des systĂšmes d’information et des rĂ©seaux, thĂ©orie et expĂ©rimentation autour

des Network-Sciences.

MĂšne une rĂ©flexion thĂ©orique sur la « gĂ©ographie de l’information » Ă  l’heure des rĂ©seaux distribuĂ©s comme le

web et des systùmes complexes. En particulier, il s’agit d’essayer de comprendre les principes de l’architecture

documentaire du web. Ce travail thĂ©orique s’accompagne du dĂ©veloppement d’une ingĂ©nierie scientifique et donc

différents projets technologiques comme la société R.T.G.I. lauréate du concours OSEO-ANVAR en 2006, le portail

dĂ©diĂ© Ă  l’ingĂ©nierie web web-mining.fr ou les projets expĂ©rimentaux dirigĂ©s par l’association de recherche

WebAtlas dont il est le président. (1) The Laws of the Web, Patterns in the Eco-

logy of Information, B.A. Huberman, M.I.T.-

Press, 2001.

Page 10: Novembre 2008 i-mag
Page 11: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 9

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

cet exercice patient et minutieux de « tra-duction » des donnĂ©es statistiques, tech-niques et formelles en propriĂ©tĂ©s spa-tiales puis en modĂšle gĂ©nĂ©ral que le webcommence Ă  « prendre corps », comme(enfin) rendu visible et apprĂ©hendable.Dans ces tĂąches d'exploration degrandes BDD associĂ©es Ă  des systĂšmesd'information, la construction demodĂšles thĂ©oriques du web peut s’ap-puyer sur des bases mathĂ©matiques etstatistiques mais aussi sur la thĂ©orie desgraphes qui reprĂ©sentent un puissantmoyen de rĂ©duction de la complexitĂ© decertains systĂšmes. Si les graphes peu-vent ĂȘtre mobilisĂ©s dans des tĂąches decalcul, ils peuvent aussi ĂȘtre visualisĂ©s,offrant alors des types particuliers de «vues cartographiques » reprĂ©sentativesde la distribution de l’information sur leweb, Ă  grande Ă©chelle comme localement.

A la recherche de patterns

Les milliards de pages qui constituent leweb peuvent ĂȘtre indexĂ©es (dĂ©crites) etcomparĂ©es par leurs contenus ou lesliens hypertextes qu’elles distribuententre elles, formant de vastes systĂšmesque seule la thĂ©orie des graphes peutaider Ă  rĂ©duire. C’est en projetant lespages (ou leur « contenu ») dans unespace thĂ©orique (Ă  titre de noeuds) ainsique leurs liens rĂ©ciproques (Ă  titre d’arcsou de vecteurs) que l’on peut alors com-prendre les propriĂ©tĂ©s topo-logiques duweb comme systĂšme d’information. LesdonnĂ©es extraites du web sont traitĂ©essous forme de matrice de graphes, lais-sant ainsi apparaĂźtre aux chercheurs cer-taines propriĂ©tĂ©s de cet espace docu-mentaire inĂ©dit, propriĂ©tĂ©s que l’on peutaussi visualiser.Techniquement, les donnĂ©es traitĂ©esdans cette ingĂ©nierie d’exploration desstructures du web sont constituĂ©es sur-tout par des indicateurs de contenu asso-ciĂ©s Ă  des URL (quels sites parlent dequoi ?) et par la distribution entre cesderniĂšres des liens hypertextes (les sitesqui parlent de la « mĂȘme chose » sont-ilsreliĂ©s entre eux ?). Dans ce type d’ap-proche, un effort particulier porte doncsur l’étude conjointe des degrĂ©s de simi-laritĂ© de contenu entre plusieurs(dizaines) milliers de documents et leur

proximitĂ© topologique en termes de lienshypertextes. La production de « carto-graphies du web » suppose donc lafusion de plusieurs traditions scienti-fiques : celle de l’indexation des docu-ments et des moteurs de recherche, cellede la thĂ©orie des graphes (qui a com-mencĂ© dĂšs le XVIIIe siĂšcle !) et celle,

enfin, des techniques d’InformationVizualisation (InfoViz) et des interfacesdestinĂ©es Ă  mapper de grands ensemblescomplexes de donnĂ©es.La visualisation de grands graphes rĂ©vĂšleainsi quelques propriĂ©tĂ©s structurellesdu web fascinantes. Certains patternsou schĂšmes organisationnels de ce sys-

A gauche, Etienne Louis BoullĂ©e, vue de la nouvelle salle projetĂ©e pour l’agrandissement de la Bi-bliothĂšque Nationale, 1791. A droite, prĂšs de 2.000 sites publiĂ©s sur le web europĂ©en et traitantdes problĂ©matiques « science dans la sociĂ©tĂ© » (WebAtlas). Le web ne ressemble pas Ă  une biblio-thĂšque et la logique de distribution de l’information n’épouse pas la rigueur des arborescences oude hiĂ©rarchies encyclopĂ©diques. Cette architecture distribuĂ©e n’est pourtant pas non plus gouver-nĂ©e par le hasard et prĂ©sente des « strong regularities » qu’il faut expĂ©rimentalement arriver Ă dĂ©crire. L’étude des propriĂ©tĂ©s natives de ces territoires numĂ©riques peut permettre d’adapter lestechnologies de search existantes ou de comprendre la nature de certains phĂ©nomĂšnes comme lapropagation d’une information ou la constitution de communautĂ©s sociales sur le rĂ©seau.

Dans certaines conditions, on peut apercevoir le regroupement de certains mots ou expressionsen projetant sous forme de graphe leurs relations statistiques d’occurrence (tel mot apparaĂźt surle web plus souvent avec tel autre). Ici, ont Ă©tĂ© visualisĂ©es en trois dimensions les relations dehiĂ©rarchie (grosseur du nƓud suivant l’importance du mot dans le corpus) et de proximitĂ© (oude « complĂ©mentaritĂ© » thĂ©matique) des expressions principales de prĂšs de 27.000 pages consa-crĂ©es aux cosmĂ©tiques :radicaux libres, principes actifs, cosmĂ©tiques naturels, produits cosmĂ©-tiques, produits de soins, peaux sĂšches, produits de beautĂ©, produits de soin, soins du visage
On peut tirer de lĂ  des indicateurs puissants sur la façon dont les internautes s’emparent de cer-taines thĂ©matiques, et comment ils le font.

Page 12: Novembre 2008 i-mag

I-MAG - NOVEMBRE 200810

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

tĂšme distribuĂ© et ouvert sont aujourd’huiconnus et testĂ©s sur des jeux de don-nĂ©es variĂ©s, d’autres restent Ă  dĂ©couvrir.Les questions de « couches », de « hau-teur », voire de « profondeur » y tiennentune place dĂ©terminante mais aussi« d’orientation » et de « concentration »,comme dans une physique des phĂ©no-mĂšnes magnĂ©tiques. Les principes quipermettent de dĂ©crire les lois de cettearchitecture documentaire constituĂ©e dedizaines de milliards de pages commeceux qui prĂ©sident Ă  la construction de« cartographies du web » reposent surun ensemble d’hypothĂšses issues de lacommunautĂ© scientifique (essentielle-ment amĂ©ricaine) dĂšs les annĂ©es 1996-1997. Les notions de « distance », « cen-tralitĂ© », « Ă©loignement », « proximitĂ© »,« voisinage », « concentration » ou de« couches » s’enracinent dans une sĂ©riede travaux orientĂ©s vers l’explorationsemi-automatique de l’architecture docu-mentaire du web. Dans ces contributionsrĂ©centes se mĂȘlent aussi bien des ques-tions d’algorithmes de traitement desdonnĂ©es que des mĂ©thodes d’extractionde l’information via des crawling-sys-tems ou bien encore d’optimisation deprocess dĂ©jĂ  existants comme les grandssystĂšmes YAHOO!, Google ou le projetIBM-Webfountain. Cette lignĂ©e de contri-butions thĂ©oriques et de comptes-rendusd’expĂ©rimentations esquisse une pos-sible gĂ©ographie gĂ©nĂ©rale du systĂšme.C’est le cas, en particulier, des travauxde J. Kleinberg sur l’organisation gĂ©nĂ©-rale des corpus de pages web distribuĂ©sen agrĂ©gats dotĂ©s de « cƓurs » oĂč sontconcentrĂ©s les meilleurs scores de

Hubs/Authorities. HITS (HypertextInduced Topic Search) a Ă©tĂ© conçu pourdĂ©tecter ces coeurs de ressources Ă  partirde l’analyse de leurs liens rĂ©ciproques Ă des Ă©chelles rĂ©duites ou moyennes duweb (2). On parle ainsi maintenant cou-ramment « d’agrĂ©gats de documentsweb » pour qualifier ce processus deconcentration thĂ©matique et hypertex-tuelle Ă  l’Ɠuvre sur le web. Davison(IBM) dĂ©veloppe le concept de « topicallocalities » dĂšs 2000 (3) tandis que l’oncommence Ă  explorer la morphologiegĂ©nĂ©rale du systĂšme en 1998 avec lapublication du fameux modĂšle du web« en nƓud papillon » par A. Tomkins etal. (4).Ces premiers travaux pionniersont donnĂ© naissance Ă  une famille d’al-gorithmes et de mĂ©thodes qui portent

aussi bien sur les techniques d’extrac-tion des donnĂ©es web (crawling systems)que sur leur description (indexation) oubien mĂȘme leur visualisation (web infor-mation vizualisation).Les questions de topologie documentairesur le web (ou dans les grands systĂšmescomme certains intranets d’entreprise)occupent donc une place centrale depuislors en termes de recherche et dĂ©velop-pement. La communautĂ© des « explora-teurs du web » est actuellement concen-trĂ©e sur deux problĂ©matiques essentielles.Celle de la temporalitĂ© ou l’étude desphĂ©nomĂšnes dynamiques sur le web, Ă laquelle a grandement contribuĂ© V.-L.Barabasi et son Ă©quipe de l’UniversitĂ©de Notre-Dame en proposant desmodĂšles de scĂ©narios Ă©volutifs (5). Deson cĂŽtĂ©, D. Watts Ă  l’UniversitĂ© deColumbia dĂ©veloppe une sĂ©rie d’hypo-thĂšses sur les scĂ©narios de propagationde l’information dans des grands sys-tĂšmes comme le web (peut-on modĂ©liserla propagation des virus informatiques ?Celle d’une rumeur sur un rĂ©seau deblogs ? Quand et comment un systĂšmecomme le web vit-il certaines phases cri-tiques de mutation ?...) (6).

Enjeux d’une « gĂ©ographie de l’information »Les mĂ©thodes et les outils de web-map-ping concentrent des enjeux importantsen termes de recherche et d’innovation.On peut les ranger parmi les technolo-gies de knowledge mapping et de know-ledge discovery et incarnent les effortsrĂ©alisĂ©s par les ingĂ©nieurs et les cher-cheurs pour comprendre les rĂšgles qui

Des dispositifs expĂ©rimentaux d’exploration dynamique de grandes masses de donnĂ©es existent aujourd’hui. Une interface de type cartographique per-met de jouer sur les niveaux de zoom, de visualiser diffĂ©rents niveaux et type de liens entre les documents et, aussi, de tracer l’évolution temporelledu systĂšme mappĂ© (ajout/suppression de liens hypertextes parmi ces quelques 2.000 blogs, propagation d’une information via l’indexation des postset commentaires
) sans oublier l’accĂšs direct aux URL. Ici, le site de veille des blogs dĂ©diĂ©s aux Ă©lections amĂ©ricaines dĂ©veloppĂ© par la SAS compiĂš-gnoise R.T.G.I. (http://presidentialwatch08.com/)

(2) Jon M. Kleinberg, “Authoritative sources in a

hyperlinked environment”, Journal of the

ACM (JACM), Volume 46 , Issue 5 (Septem-

ber 1999)

(3) Brian D. Davison, “Topical locality in the

Web”, Proceedings of the 23rd Annual In-

ternational Conference on Research and De-

velopment in Information Retrieval, SIGIR

2000, ACM-Press.

(4) Ravi Kumar, Prabhakar Raghavan, Sridhar

Rajagopalan, D. Sivakumar, Andrew Tom-

kins, Eli Upfal, “Graph structure in the web:

experiments and models”,

http://www.almaden.ibm.com/webfoun-

tain/publications/../resources/TheWebasa-

Graph.pdf

(5) http://www.nd.edu/~alb/

(6) Duncan Watts, Six Degrees : The Science of

a Connected Age, W. W. Norton & Company;

1st edition (February 2003)

Page 13: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 11

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

gouvernent ce vaste systĂšme que l’ondĂ©crivait jusqu’à prĂ©sent comme com-posĂ© de donnĂ©es « en grandes masses,dynamiques et peu structurĂ©es ». LeurpremiĂšre valeur est d’ordre expĂ©ri-mentale pour les chercheurs : les « vues» du web constituent des modĂšles desynthĂšse thĂ©orique et des instrumentsde concentration de l’expertise. Maisles cartographies ne sont jamaisstables, non seulement parce qu’ellesĂ©voluent dans le temps, mais aussiparce qu’elles sont numĂ©riquementmanipulables. C’est en faisant varier,Ă  partir d’un modĂšle de dĂ©part, les trai-tements sur les donnĂ©es et les typesde visualisation qu’apparaissent les

patterns les plus stables. Pour les scien-tifiques, produire des « formes »visuelles du web c’est donc entrer dansun dialogue intense entre modĂšlesthĂ©oriques possibles et sessions expĂ©-rimentales de relevĂ© et de traitementdes donnĂ©es : projections graphiquesdes connaissances acquises elles sontaussi comme un concentrĂ© des pisteset des hypothĂšses encore Ă  parcourir.Les cartographies de documents webpeuvent aussi prĂ©figurer de nouvellesmĂ©thodes ou de nouveaux algorithmesqui viendront amĂ©liorer les systĂšmesd’information web comme les moteursde recherche. La manifestation visuellede propriĂ©tĂ©s statistiques de grandscorpus de pages ou de sites permet demettre Ă  jour des contraintes aux-quelles seront confrontĂ©es les techno-

logies et les mĂ©thodes d’extractioncomme d’indexation de documentsqui se rĂ©vĂšlent regroupĂ©s en agrĂ©gatsthĂ©matiques (donc Ă©ventuellementd’opinion, de communautĂ©s socialesou d’intĂ©rĂȘts utilisant chacune leurpropre vocabulaire ou folksonomies
).Au-delĂ  de ces « cƓurs » thĂ©matiquespeuplĂ©s de mots et de liens hyper-textes, Ă  moyenne Ă©chelle, les carto-graphies manifestent des lignes de frac-ture entre corpus (boundaries), desniveaux d’inclusion, de complĂ©men-taritĂ© ou de hiĂ©rarchie, laissant aper-cevoir les linĂ©aments d’une gĂ©ographiegĂ©nĂ©rale de l’information sur le web.En termes d’outils de recherche avan-cĂ©s pour l’utilisateur ou de servicespour des experts, elles laissent aussiprĂ©figurer de nouvelles interfaces pourla recherche d’information. En retour,la recherche de patterns dans des don-nĂ©es indexĂ©es contribue souvent Ă  lavalorisation du patrimoine informa-tionnel des entreprises puisqu’ellesrĂ©vĂšlent souvent des principes d’orga-nisation jusque lĂ  implicites, pour toutdire invisibles.Enfin, il paraĂźt Ă©vident que les carto-graphies dynamiques de grandesmasses de donnĂ©es web contribuentĂ  l’amĂ©lioration des systĂšmes de veillestratĂ©gique et constituent donc ausside puissants outils d’aide Ă  la dĂ©cision

La construction d’une cartographie rĂ©-clame plusieurs Ă©tapes.1. Choix des URL et indexation de leurscontenus et de leurs liens hypertextes rĂ©-ciproques2. Les donnĂ©es sont traitĂ©es sous forme dematrices de graphes (nƓuds = sites, arcs= liens hypertextes)3. Le graphe est spatialisĂ© dans le logicielGraphiltre. On applique une force auxnoeuds-sites pour qu'ils se repoussenttandis que les arcs-liens les retiennent : legraphe prend forme. 4. Mise en forme graphique : les sites lesplus connectĂ©s sont mis en hauteur et ren-dus plus gros. Des couleurs sont choisiespour les diffĂ©rents types de sites. Un anglede vue est choisi pour la « scĂšne 3D ».5. Rendu : La scĂšne contenant le graphe en3D est transformĂ©e en image avec Persis-tance of Vision. Les nƓuds sont peintscomme des boules transparentes colorĂ©eset les liens comme des rubans pointus.6. En indexant rĂ©guliĂšrement les donnĂ©es,on peut ainsi mapper le rĂ©seau des adhĂ©-rents Ă  l’APRIL et comparer Ă  diffĂ©rentesĂ©tapes l’organisation des donnĂ©es.

RĂ©sultats de la requĂȘte « abortion » surYAHOO ! spatialisĂ©s sous forme degraphes. Alors que dans l’interface du mo-teur les rĂ©sultats sont affichĂ©s par dĂ©fautsous forme de listes Ă  plat, un graphe desliens hypertextes montre lui des affinitĂ©scommunautaires Ă©videntes : en bleu les «pro-choice » dĂ©fenseurs du droit Ă  l’avor-tement aux Etats-Unis et, d’un autre cĂŽtĂ©,les « pro-life » ardents dĂ©fenseurs du droit« Ă  la vie ». Cette cartographie montre Ă quel point les documents web sont orga-nisĂ©s en agrĂ©gats, parfois trĂšs compĂ©titifs.

Page 14: Novembre 2008 i-mag

Utilisation des réseaux sémantiques

dans la recherche Web

I-MAG - NOVEMBRE 200812

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Les bases du Web Search

Cela fait plus de 10 ans que les grandsmoteurs de recherche sont apparus surle Web. Une grande partie des efforts aĂ©tĂ© consacrĂ©e Ă  conserver une grandepertinence et fraĂźcheur des donnĂ©esmalgrĂ© une croissance exponentielle desvolumes et l’explosion de la fraude. Mais,en fait, la recherche se fait toujours selonle mĂȘme principe. On extrait tous lesdocuments qui contiennent les mots-clĂ©s de la requĂȘte (ou un grand nombrequand ceux-ci sont trop nombreux) eton applique une fonction de pertinenceou « ranking » Ă  chacun d’eux de façon Ă pouvoir les ordonner. Pour ce faire, on

associe à chaque document un vecteurformé par ses termes pondérés par unevaleur. La formule la plus classique estappelée td.idf pour « term frequency xinverse document frequency »

On considĂšre que plus un terme est frĂ©-quent dans l’index moins il est impor-tant. A noter que cette pondĂ©ration aĂ©tĂ© largement rĂ©visĂ©e car les spammeurscrĂ©aient des documents avec un nombreartificiellement Ă©levĂ© de termes de façonĂ  augmenter le « tf » de leur document.Pour mesurer la similaritĂ© entre larequĂȘte et un document, on calcule lecosinus de l’angle formĂ© par ces deuxvecteurs.

En fait, cette approche pose un pro-blĂšme car deux mots diffĂ©rents sontconsidĂ©rĂ©s comme des dimensions dif-fĂ©rentes du modĂšle et donc orthogo-nales. Par exemple, un document conte-nant UEFA mais pas football ne seradonc pas considĂ©rĂ© comme un bonrĂ©sultat pour la requĂȘte « football ».

Introduction de la sémantique

Depuis plusieurs annĂ©es les laboratoirestravaillent sur l’introduction d’un peu desĂ©mantique dans les moteurs derecherche. On peut distinguer deux typesd’approches : ascendantes et descen-dantes. La premiĂšre part du documentd’origine et pousse Ă  le complĂ©ter avecdes informations qui permettent demieux l’analyser et donc de mieux l’in-dexer. L’autre, Ă  l’inverse, part de larequĂȘte en essayant de mieux la com-prendre afin de promouvoir des rĂ©sul-tats plus pertinents.L’enrichissement des documents paraĂźten effet une bonne idĂ©e. Une proposi-tion appelĂ©e micro-formats propose aucrĂ©ateurs de document HTML d’ajouterdes balises qui ne serviront pas cettefois-ci Ă  modifier l’affichage mais Ă mieux qualifier le texte qu’elles dĂ©limi-tent. GĂ©nial ! Seulement voilĂ , avantd’avoir une couverture suffisante du web,cela va prendre longtemps, trĂšs long-temps. Des approches qui s’appuient surun enrichissement automatisĂ© ducontenu semblent donc nĂ©cessaires sil’on veut arriver rapidement Ă  unegrande couverture du Web.L’approche descendante qui essaie decomprendre la requĂȘte est complĂ©men-taire de la prĂ©cĂ©dente. PremiĂšrement,on essaie de segmenter la requĂȘte. Parexemple la requĂȘte « restaurant chinoisgrenoble » pourra ĂȘtre dĂ©coupĂ©e suivantle schĂ©ma « quoi / oĂč », une fois identifiĂ©

Par Gilles VANDELLEDirigeant Ă©quipe Search Backend Platform dans le centre de R&D de Yahoo

GGiilllleess NNaaddeellllee dirige l’équipe Search Backend

Platform dans le centre de R&D de Yahoo basé à

Grenoble. DiplĂŽmĂ© de l’Ecole Centrale de Paris en

82 il a participé à la création de startups en

France et en Californie. Il travaille dans le domaine

de l’internet depuis 1998 oĂč il s’est spĂ©cialisĂ©

sur les techniques de machine learning.

Page 15: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 13

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

que grenoble est bien une ville.Attention, toutefois aux faux amiscomme « crÚme chantilly».

Représentation des connaissances

Pour effectuer toutes ces analyses, ilest donc nĂ©cessaire de disposer devastes bases de connaissances sousforme d’ontologies. Plusieurs projetsexistent dans ce domaine comme, parexemple, le langage OWL du W3C oule projet dbpedia. Mais, la crĂ©ationd’ontologies pose certains problĂšmes.PremiĂšrement, le web est un mediavivant et il faut constamment faire desmises Ă  jour. DeuxiĂšmement, uneapproche trop thĂ©orique doit se plierĂ  ce qui est communĂ©ment admisdans la langue courante. Par exemple,une « machine Ă  laver » est un « lavelinge » et non un « lave vaisselle ». Quand on dispose d’une telle base, onpeut amĂ©liorer notre systĂšme derecherche de documents. Pour chaquedocument, on sĂ©lectionne les conceptsqui le reprĂ©sentent le mieux. On fait,de mĂȘme, avec la requĂȘte. Notre fonc-tion de similaritĂ© se voit donc enrichiede dimensions qui tiennent, cette fois-ci, compte de la sĂ©mantique.

Web mining ou commentapprendre Ă  partir du web

Comme le coĂ»t de crĂ©ation et de miseĂ  jour des bases de connaissancedevient vite prohibitif, on a pensĂ© Ă automatiser ce processus. De nouvellesapproches permettent de les fabriquerautomatiquement Ă  partir de connais-sances prĂ©sentes sur le web. Onappelle cela web-mining. C’est undomaine passionnant qui permet d’ex-traire de cette immense source nonstructurĂ©e qu’est le Web des donnĂ©esutilisables pour l’analyse sĂ©mantique.L’enjeu est immense car il permettrad’apprĂ©hender non seulement ladimension multilingue et multicultu-relle du web mais aussi son Ă©volutionrapide. De quoi s’agit-il ? DerriĂšre lagrande idĂ©e « extraire des connais-sances du web », on peut diffĂ©rentier

deux familles. La premiĂšre, extrait desinformations de la structure mĂȘme de« la toile » en explorant les liens entreles pages et les sites, la seconde s’in-tĂ©ressant plutĂŽt aux concepts conte-nus dans ces pages.Les liens entre les pages d’un mĂȘmesite et encore plus entre les pages desites diffĂ©rents nous apportent beau-coup d’informations. Le texte (href)portĂ© par ces liens est largement uti-lisĂ© par les moteurs de recherche pourpromouvoir une page lors de l’indexa-tion. Certains vont bien au delĂ  en pro-posant des cartographies thĂ©matiquesdu web. Cela permet d’identifier lescourants de pensĂ©e, les vecteurs d’in-fluence et leurs Ă©volutions. Il n’est pasĂ©tonnant de voir les spĂ©cialistes dumarketing se pencher de plus en plussur ces Ă©tudes pour analyser, parexemple, l’image portĂ©e par une marque.L’autre approche consiste Ă  bĂątir desrĂ©seaux de concepts. En premier, il fautassocier Ă  chaque page un certainnombre de concepts reprĂ©sentatifs.Chaque concept est associĂ© Ă  une ouplusieurs listes de mots. Une fois cecirĂ©alisĂ©, on utilise les co-citations ou lescorĂ©fĂ©rences entre ces concepts pourconstruire le graphe. Le graphe ainsiobtenu porte souvent un grand nombrede dĂ©fauts dus entre autre Ă  l’ambi-guĂŻtĂ© de la langue. Par exemple, « ParisHilton » et « Ville de Paris » risquentd’ĂȘtre reliĂ©s par le terme « Paris ». Desanalyses en composantes connexes etle clustering permettent d’éliminer unbon nombre de ces dĂ©fauts.Les graphes ainsi construits ne sontpas aussi rigoureux que les ontologies

construites par des experts mais reprĂ©-sentent bien les relations entre lestermes. La Fig1 donne le graphe fabri-quĂ© pour analyser la requĂȘte « UEFA ».

les réseaux sociaux

Certains prĂ©voient dĂ©jĂ  le coup suivant.A la base, un constat simple : ce quiest un bon rĂ©sultat pour moi ne l’estpeut ĂȘtre pas pour quelqu’un d’autre. Ilfaut donc personnaliser les rĂ©sultats.L’exploitation du profil des utilisateurssemble prometteur seulement voilĂ , laplupart d’entre nous rechigne Ă rĂ©pondre Ă  des questionnaires plus aumoins longs sur leurs centres d’intĂ©-rĂȘts. Il faut donc trouver des sourcesmoins explicites. Une approche plussournoise consiste Ă  stocker les « clics »et conserver la trace laissĂ©e par chacund’entre nous. Ce type d’approche estcontestable d’un point de vue Ă©thiquesauf si l’on agrĂšge les donnĂ©es indivi-duelles au niveau d’un groupe. Nousvoyons donc poindre de plus en plusde solutions basĂ©es sur des rĂ©seauxsociaux. Des solutions comme deli-cious.com permettent de partager sestags avec la communautĂ© et de mettreen valeur les pages taguĂ©es par les per-sonnes de son rĂ©seau.Dans les annĂ©es qui viennent, nousallons voir encore progresser ces tech-niques de recherche d’information nonseulement au niveau du web searchmais Ă©galement dans les moteurs derecherche spĂ©cialisĂ©s dans les donnĂ©esde l’entreprise.

❃

fig.1

Page 16: Novembre 2008 i-mag

Web Services et Grid Computing : la nouvelle Úre des systÚmes distribués

I-MAG - NOVEMBRE 200814

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

S'affranchir du matériel

L'idĂ©e d'utiliser les ordinateurs alorsmĂȘme qu'ils rĂ©alisent dĂ©jĂ  une tĂącheplus ou moins gourmande et de regrou-per cette puissance grĂące Ă  Internet n’estpas nouvelle. Entre 1997 et 2000, lesprojets de calculs distribuĂ©s Distributed.Net1

(répondre au concours lancé par lasociété RSA pour casser des clés de cryp-tage) ou Seti@Home2 (analyse dessignaux électromagnétiques pour décou-vrir ainsi de la vie extra-terrestre) ontdémontré que le concept était valide.Le rapport coût/puissance des ordina-teurs a continué à évoluer dans un senspositif ces derniÚres années. Le coûtprincipal des infrastructures n'est doncpas dans le matériel, mais dans tout cequi l'entoure : l'hébergement, le réseau,mais aussi tout ce qui va permettre lasurveillance et la réparation de cesmachines. Ces coûts évoluent en fonc-tion du nombre de machines installées.

Quelques soient les besoins (production,dĂ©veloppement et tests, data-mining),les machines ne sont pas utilisĂ©es Ă  leurpleine capacitĂ© : un site web n’utiliserala pleine puissance de ses serveurs quelors de pics de trafic, les machines dedĂ©veloppement ne fonctionneront quependant les heures de travail ou pour denouvelles versions Ă  tester. Cela pose leproblĂšme de plus en plus sensible del'impact Ă©cologique et cela fait enragertout gĂ©rant de sociĂ©tĂ© voyant qu'unepartie de ses frais fixes ne servent enfait Ă  rien du tout.Il est donc extrĂȘmement important demettre en place des mĂ©canismes per-mettant d'optimiser l'utilisation desmachines en tenant compte du tempsd'utilisation, en ayant la capacitĂ©d'agrandir ou de rĂ©duire la voilure demaniĂšre souple et rapide.

La virtualisation mise Ă  profit

Les progrÚs des systÚmes de virtualisa-tion sont en partie à l'origine de lamontée en puissance des premiÚresoffres de Cloud Computing. Dans cedomaine, la technologie open-source Xenest utilisée pour répondre à ce besoinde flexibilité.La société Gandi, connue en tant queDomain Name Registrar, base son offred'hébergement sur cette technologie etles outils qu'elle a développés autour decelle-ci. Gandi vous propose3 de louerdes parts de serveurs puissants et vous

Par RĂ©my Amouroux,Ensimag 1992, TEOREM - co-fondateur de Kelkoo

Le Grid Computing ou Cloud Computing est le dernier abou-tissement d'une longue évolution d'un concept assez ancien: cela fait référence à l'utilisation de la mémoire et des ca-pacités de calcul des ordinateurs et des serveurs répartisdans le monde entier, et liés par un réseau, tel Internet. Lesutilisateurs de la grille ou du nuage pourraient ainsi dispo-ser d'une puissance informatique considérable et modu-lable.

RRĂ©Ă©mmyy AAmmoouurroouuxx est un des co-fondateurs deKelkoo et l'inventeur de la technologie qui en apermis la crĂ©ation. Chez Kelkoo, il a dirigĂ© etorientĂ© le dĂ©veloppement d'applications Internets'adressant aussi bien au public qu'Ă  sesclients, jusqu'Ă  l'acquisition de la sociĂ©tĂ© parYahoo en 2004. Il est devenu Chief Architectpour l'Europe chez Yahoo, supervisant le dĂ©ve-loppement d'applications destinĂ©es Ă  l'une desplus grosses audiences du Web. En 2008, il acrĂ©Ă© Teorem, un cabinet de conseil, afin d'ai-der les entreprises Ă  dĂ©passer les obstaclestechniques empĂȘchant leur croissance.

Page 17: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 15

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

permet de moduler, en fonction decontraintes horaires, le nombre de ser-veurs et le nombre de parts (donc lapuissance) effectivement loués, sansque cette montée en puissance néces-site de redémarrer les applications.L'autre point intéressant de cette offreest l'assurance qu'en cas de problÚmesur la machine sur laquelle s'exécutentvos parts, ces derniÚres sont automa-tiquement transférées sur d'autresmachines avec le moins d'impact pos-sible pour les utilisateurs.Un autre utilisateur de la technologieXen est le systÚme EC24 d'Amazon.L'offre vous permet de créer desimages de votre serveur contenant les

applications et les donnĂ©es qui sontnĂ©cessaires Ă  son fonctionnement, touten paramĂ©trant le processeur, lamĂ©moire et le stockage qui leur per-mettront de s'exĂ©cuter de maniĂšreoptimale. Une fois l'image crĂ©Ă©e, il estpossible de la dĂ©marrer et elle se com-porte comme un serveur rĂ©el. Amazonvous fera payer le temps d'exĂ©cution(l'unitĂ© Ă©tant l'heure) et les transfertsde donnĂ©es entrant et sortant durĂ©seau d’Amazon. A cette modularitĂ©des coĂ»ts qu'apprĂ©cieront les respon-sables financiers s'ajoutent trois fonc-tionnalitĂ©s importantes qu'apprĂ©cie-ront les concepteurs d'applications.Pouvoir dĂ©finir des images des serveurs

Ă  l'avance permet de dĂ©ployer trĂšsrapidement de nouvelles instances,mais facilite aussi grandement l'auto-matisation de tests. La gestion par webservices du dĂ©ploiement des imagesrend possible l’automatisation de lataille de la plateforme en fonction desbesoins rĂ©els, comme le montre ScalR5.Le service d’Availability Zone, associĂ©au service d'Elastic IP Address, permetde rĂ©pondre aux besoins de haute dis-ponibilitĂ©.Les nombreux services fournis parAmazon sont une premiĂšre base pours'affranchir des problĂšmes matĂ©rielsmais ils restent au niveau du serveur :le dĂ©veloppeur doit toujours concevoirdes applications scalables, rĂ©silienteset dont l'architecture est Ă©volutive etmodulaire pour en profiter.

Aller plus loin avec Hadoop6

En Juillet dernier, Yahoo, Hewlett-Packard et Intel ont annoncĂ© l’initia-tive Cloud Computing Test Bed. Chacundes 6 centres de recherches associĂ©sau projet aura Ă  sa disposition uneferme de 1000 Ă  4000 machines afinde procĂ©der Ă  des expĂ©riences deCloud Computing. Le matĂ©riel serad'origine HP et Intel. Yahoo apporterason savoir-faire autour du projetHadoop. Ce dernier est issu de la fon-dation apache ; il fut crĂ©Ă© par DougCutting, le dĂ©veloppeur Ă  l'origine duprojet Lucene, pour supporter la dis-tribution dans le moteur de rechercheNutch. Il est composĂ© d’un moteur audessus d’un systĂšme de stockage.HDFS (Hadoop Distributed File System)stocke les donnĂ©es sur lesquelles tra-vailleront les applications. Il assure leurdistribution sur plusieurs nƓuds et leurhaute disponibilitĂ©. Les nƓuds utilisentle rĂ©seau pour servir des blocs de don-nĂ©es et ils se parlent pour assurer unebonne distribution des blocs et assu-rer que leur rĂ©plication reste Ă  un hautniveau. Le moteur est une implĂ©men-tation du modĂšle de programmationMap/Reduce, que Google a prĂ©sentĂ© en2004 Ă  la confĂ©rence OSDI7. C’est unframework, Ă©crit en Java, permettantle traitement distribuĂ© de trĂšs gros jeux

LLLL EEEE MMMM OOOO TTTT EEEE UUUU RRRR MMMM AAAA PPPP //// RRRR EEEE DDDD UUUU CCCC EEEE

Le mĂ©canisme Map/Reduce demandeaux dĂ©veloppeurs de dĂ©finir un certainnombre de fichiers comme input (ceux-ci Ă©tant stockĂ©s dans HDFS) et deuxfonctions, l’une pour la phase Map, etl’autre pour la phase Reduce.La phase d’Input du moteur se chargede sĂ©parer les fichiers en parts plus oumoins Ă©gales et de les affecter Ă  destĂąches Map.La fonction dĂ©finie en tant que Mapest exĂ©cutĂ©e durant cette phase pourtransformer une entrĂ©e considĂ©rĂ©ecomme un ensemble de paires clĂ©-valeur en un autre ensemble de pairesclĂ©-valeur. Par exemple, une ligne delog d’un site web sera considĂ©rĂ©e

come une seule paire et pourra ĂȘtre transformĂ©e en ses diffĂ©rents constituants : IP duclient, page accĂ©dĂ©e, code http, etc.La phase Shuffle (fournie par Hadoop) trie les paires clĂ©-valeur et les redistribuent versles tĂąches Reduce. La fonction dĂ©finie pour cette phase regroupe les paires ayant lamĂȘme clĂ© pour en crĂ©er de nouvelles. Par exemple, c’est dans cette phase que l’onpourra compter le nombre de hits par seconde dans le cas de l’analyse des logs d’unsite web.La derniĂšre phase est en charge de l’écriture de fichiers de sortie, en gĂ©nĂ©ral versHDFS.Le moteur est en charge de crĂ©er et de distribuer les tĂąches sur le cluster utilisĂ©. PardĂ©faut, il crĂ©e autant de tĂąches Map qu’il y a de blocs HDFS Ă  traiter, mais cela peut ĂȘtrecontrĂŽlĂ© si l’on dĂ©finit la taille minimale de partition des fichiers. Le nombre de tĂąchesReduce dĂ©pend de la taille des donnĂ©es Ă  traiter bien sĂ»r, mais le moteur va essayerd’utiliser le plus possible de nƓuds disponibles dans le cluster.

Page 18: Novembre 2008 i-mag

I-MAG - NOVEMBRE 200816

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

de donnĂ©es, vus comme des ensemblesde paires clĂ©-valeur (voir l’encadrĂ©).Map/Reduce est un modĂšle de pro-grammation simple utilisĂ© pour rĂ©soudrede nombreux problĂšmes. Le traitementde fichiers log de toutes sortes vientnaturellement Ă  l’esprit, mais le projetNutch a dĂ©montrĂ© que ce modĂšle Ă©taitaussi trĂšs utile dans le cadre d’un moteurde recherche. C’est aussi un modĂšle audessus duquel il est possible deconstruire des modĂšles plus complexes(voir l’encadrĂ© sur PIG). Bien qu’écrit

en Java, le framework permet d’utiliserdes logiciels externes au travers de sesAPIs dites de Streaming. L’un des avan-tages d’Hadoop est qu’il connaĂźt l’em-placement des donnĂ©es dans HDFS eten tient compte dans la distribution destĂąches sur les machines. Il est aussicapable dans sa gestion des tĂąches derĂ©-exĂ©cuter celles qui ont pu avoir unproblĂšme. De plus, sachant que dans uncluster les machines ne sont jamais com-plĂštement homogĂšnes, le framework vautiliser la puissance disponible pour exĂ©-

cuter la mĂȘme tĂąche plusieurs fois, etutiliser le rĂ©sultat de celle qui se finit enpremier et interrompre les autres.

l’avenir est aux applicationsdistribuĂ©es

L’un des points forts de ce que TimO’Reilly a appelĂ© le Web 2.0 est la pro-lifĂ©ration des interfaces de programma-tions pour des services web. Ceux-ci ontmis Ă  la disposition des dĂ©veloppeursde nombreux services rĂ©utilisables, et

PPPP IIII GGGG :::: LLLL AAAA RRRR GGGG EEEE ---- SSSS CCCC AAAA LLLL EEEE DDDD AAAA TTTT AAAA AAAA NNNN AAAA LLLL YYYY SSSS IIII SSSS8888

Pig est un environnement de programmation four-nissant aux dĂ©veloppeurs un langage de haut niveau(Pig Latin) pour exprimer des traitements de don-nĂ©es. Une fois un programme Ă©crit, il peut ĂȘtre com-pilĂ© et ĂȘtre exĂ©cutĂ© sur un cluster Hadoop. Pig Latinest prĂ©sentĂ© comme Ă©tant Ă  Hadoop ce que SQL estaux bases relationnelles. Un de ses points forts estque sa structure est trĂšs facilement parallĂ©lisable,tout en laissant cet aspect de la programmationcomplĂštement transparent pour le dĂ©veloppeur. Ilsimplifie aussi la vie du dĂ©veloppeur en lui permet-tant de dĂ©finir en un seul programme ce qui cor-respond Ă  plusieurs itĂ©rations map-reduce. Si l’on cherche, par exemple, Ă  partir des deux tablesQuery Results et Pages (voir ci-dessus) quelles sontles requĂȘtes pour lesquelles la page de plus hautPageRank n’apparaĂźt pas dans les cinq premiersrĂ©sultats, le rĂ©sultat Map-Reduce devra avoir deuxitĂ©rations (voir ci-dessous), ce qui implique au mini-mum quatre classes Java plus ou moins complexes,plus la coordination de l’exĂ©cution de ces deux itĂ©-rations.Cela s’écrira en Pig Latin de la maniĂšre ci-aprĂšs,sous une forme Ă  la fois procĂ©durale et dĂ©clarative.Nous avons lĂ  avant tout une suite de transforma-tions facilitĂ©es par les opĂ©rateurs et les fonctionsfournis par cet environnement.Il est Ă  noter que le modĂšle de donnĂ©es est assezĂ©voluĂ© (bien plus que de simples paires clĂ©-valeur)et que les fonctions disponibles sont assez com-plĂštes (opĂ©rations mathĂ©matiques, mais aussisomme, moyenne, etc) et qu’il est possible d’insĂ©-rer ses propres fonctions dans le systĂšme. Il est trĂšsintĂ©ressant de voir aussi que la traduction de requĂȘteSQL en Pig Latin est somme toute assez facile.

Page 19: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 17

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

en conjonction avec les techniquesAJAX, nous avons vu l’apparition denombreux mash-up combinant ces dif-fĂ©rents services pour en crĂ©er de nou-veaux. Il est maintenant inimaginabled’avoir son propre systĂšme de carto-graphie pour un site web : on utiliseranaturellement l’un des fournisseursexistants comme Mappy, Google ouYahoo, services dont l’intĂ©gration surun site est extrĂȘmement aisĂ©e.Cette approche de la conception d’ap-plications Internet amĂšne Ă  la distri-bution sur plusieurs plateformes de cequi compose rĂ©ellement le servicerendu Ă  l’utilisateur final, celui-cin’ayant plus aucune notion de ce quiest exĂ©cutĂ© sur sa propre machine, surles machines du site auquel il accĂšdeou sur les machines de fournisseurs decelui-ci.Les offres de Grid Computing associĂ©esaux technologies permettant la distri-bution d’une application au traversd’Internet vont encore accentuer la

dĂ©matĂ©rialisation et la virtualisationde celle-ci. Elles vont abaisser encore labarriĂšre Ă  l’entrĂ©e pour tous les dĂ©ve-loppeurs ayant des idĂ©es innovantes Ă 

rĂ©aliser et Ă  faire partager, ce quiouvrira une nouvelle Ăšre d’opportunitĂ©strĂšs intĂ©ressantes. ❃

INDEX1. Distributed.Net : projet de calcul distribué, http://www.distributed.net/2. Seti@Home : projet de calcul distribué,

http://setiathome.berkeley.edu/index.php3. Gandi HĂ©bergement avec Xen : https://www.gandi.net/heberge-

ment/offre/xen/4. Amazon Elastic Compute Cloud : http://aws.amazon.com/ec2/5. Scalr : http://code.google.com/p/scalr/ et https://scalr.net6. Apache Hadoop : http://hadoop.apache.org/7. MapReduce: Simplified Data Processing on Large Clusters _par Jef-

frey Dean et Sanjay Ghemawat,http://labs.google.com/papers/mapreduce.html

8. Pig, a language for large data analysis,http://incubator.apache.org/pig/

Page 20: Novembre 2008 i-mag

Le vote par Internet : quel avenir ?

I-MAG - NOVEMBRE 200818

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Le vote par Internet

Pour voter, l’usage classique est de serendre dans l’école primaire la plusproche de son domicile, d’aller dans l’iso-loir, de mettre dans l’enveloppe le bul-

letin de son choix, puis de mettre le toutdans l’urne en plastique transparent,tout en ayant dĂ©clinĂ© son identitĂ© etsignĂ© la liste d’émargement. Cette moda-litĂ© de vote est nommĂ©e « vote physiqueĂ  l’urne ».Maintenant, avec la dĂ©matĂ©rialisationde l’information, d’autres modalitĂ©s exis-tent :‱ Le vote avec boĂźtier Ă©lectronique (utilisĂ©par exemple lors des derniĂšres Ă©lectionsmunicipales dans certaines communes)‱ Le vote par correspondance papier‱ Le vote par tĂ©lĂ©phone, avec l’usaged’un serveur vocal interactif‱ Et enfin, le vote par InternetDe plus, le vote par Internet est souventutilisĂ© avec d’autres modalitĂ©s de vote,notamment le vote par correspondance.Cette mixitĂ© des canaux permet d’aug-menter les taux de participation enrĂ©duisant toute discrimination sur l’usagede l’outil informatique.

Pour quelles Ă©lections ?

Le vote par internet s’adresse Ă  une largevariĂ©tĂ© d’élections tel que par exemple :‱ L’élection de vos reprĂ©sentants aux

comitĂ©s d’entreprises et vos dĂ©lĂ©guĂ©sdu personnel au sein de votre entreprise‱ La dĂ©signation des rĂ©solutions enassemblĂ©e gĂ©nĂ©rale‱ L’élection de vos reprĂ©sentants rĂ©gio-nauxPar contre, le vote par Internet n’a pasvocation Ă  gĂ©rer les votes politiques ense substituant au vote physique, car cer-taines obligations Ă©lectorales (prĂ©sencede l’isoloir, authentification forte del’électeur, 
) ne peuvent ĂȘtre mises enƓuvre dans un budget raisonnable.

Les technologies utilisées

Le vote par Internet met en jeu de nom-breuses technologies, qui impactent tousles niveaux d’architecture du systĂšmed’information, tant applicatif, que logicielou matĂ©riel.Les principales technologies utilisĂ©essont :‱ Chiffrements pour la protection de la

confidentialitĂ© (RSA par exemple)‱ Empreinte de code et fonction de hash

(SHA-1)‱ Signature Ă©lectronique et authentifi-

cation Ă  base de certificat‱ Redondance matĂ©rielle pour la haute

disponibilité‹ Protocole de transport sĂ©curisĂ© (SSL

par exemple)‱Cloisonnement applicatif et matĂ©rieldes donnĂ©es

...

Par Benoit ChenonEnsimag 1986 Co-fondateur de la Société Voxaly

Le vote électronique, les boßtiers électroniques, le vote parInternet : tout le monde en parle, chacun a son mot à dire.Mais précisément de quoi parle-t-on ? Quelles sont les élec-tions concernées ? Quelles sont les techniques utilisées etpourquoi ? Quels sont ses avantages ? Comment réussir ?

BBeennooiitt CChheennoonn, Ensimag 1986, fut Architecte senior chez Atos Originpuis Capgemini, sur de grands projets nationaux,spĂ©cialisĂ© dans la sĂ©curitĂ© des SI et les architec-tures SOA (Architecture OrientĂ©e Service). A ce titre,il participa Ă  la mise en place des premiĂšres Ă©lec-tions par Internet en 2000 dans le monde bancaire.Co-fondateur de la sociĂ©tĂ© VOXALY en 2006, il estactuellement Directeur des SystĂšmes d’Informationset responsable du pĂŽle recherche et dĂ©veloppementchez VOXALY. Au sein de la FĂ©dĂ©ration Nationale desTiers de Confiance (FNTC), Il anime le groupe de tra-vail sur le vote Ă©lectronique par Internet.

Page 21: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 19

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Des avantages certains

Le vote par Internet propose de nom-breux avantages :‱ simplifie la mise en place des Ă©lec-

tions pour l’organisateur en regrou-pant dans une unique urne virtuellel’ensemble des diffĂ©rents bureaux devote,

‱ est accessible de partout, et Ă  toute heure,‱ accĂ©lĂšre le dĂ©pouillement tout en

garantissant la parfaite exactitudedes résultats,

‱ apporte une grande souplesse sur ladurĂ©e du scrutin en permettant d’éta-ler des scrutins sur plusieurs semaines,voire plusieurs mois,

‱ rĂ©duit les coĂ»ts, tant au niveau del’organisation que sur les matiĂšrespremiĂšres et l’affranchissement,

‱ et ainsi participe au dĂ©veloppementdurable.

Par rapport au vote par tĂ©lĂ©phone, levote par Internet ‱ apporte des niveaux de sĂ©curitĂ© supĂ©-

rieurs,‱ offre une ergonomie Ă©voluĂ©e et plus

intuitive,

‱ et en contrepartie, nĂ©cessite un Ă©qui-pement plus coĂ»teux et la maĂźtrise,mĂȘme minime, d’un ordinateur.

Des freins pour le vote par Internet ?Oui, pour le moment le principal freinest la confiance Ă  dĂ©montrer auprĂšsde l’électeur et des organisateurs.

Un avenir prometteur

La conception et la mise en place d’unsystĂšme de vote par Internet est uneorganisation longue, onĂ©reuse et com-plexe, faisant intervenir un grandnombre d’acteurs et de prestataires etmettant en jeu des technologies poin-tues. Par rapport Ă  la « simple urne en plas-tique transparent», une telle complexitĂ©soulĂšve davantage de doute, et peutĂȘtre le siĂšge de failles potentielles, d’er-reurs ou de malversations. Comment alors garantir la sincĂ©ritĂ© desrĂ©sultats ?Heureusement pour l’électeur et l’or-ganisateur d’élection, il existe dorĂ©na-vant un cadre lĂ©gislatif qui dĂ©taille lesnombreuses exigences auxquelles doit

rĂ©pondre un tel systĂšme de vote parInternet.De plus, la Commission NationaleInformatique et LibertĂ© (CNIL) a Ă©misde nombreuses recommandationsaussi bien au niveau organisationnelqu’au niveau applicatif et technique.Ainsi, le respect de ses diffĂ©rentesrecommandations, la dĂ©finition prĂ©-cise des rĂŽles de chacun et une exper-tise du systĂšme de vote dans sonensemble (pas uniquement de la partieinformatique mais incluant aussi l’or-ganisation et les processus) par unorganisme tiers indĂ©pendant du pres-tataire permet d’atteindre un niveaude sĂ©curitĂ© en conformitĂ© avec le codeĂ©lectoral et d’apporter la confiancenĂ©cessaire.Telles sont les conditions indispen-sables pour rĂ©ussir une opĂ©ration devote par Internet.Un prestataire rĂ©pondant Ă  tous cescritĂšres est un Electionneur Âź. Un tellabel garantit le succĂšs des opĂ©rationsĂ©lectorales, dans une enveloppe bud-gĂ©taire attractive.

❃

Page 22: Novembre 2008 i-mag

CrĂ©dit de particulier Ă  particulierL’argent sans la banque ?

20

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Quand les réseaux sociauxinvestissent la finance

l’Internaute veut ses finances enligne 
Les services bancaires de base sontparmi les plus utilisĂ©s sur Internet. Au-jourd’hui, l’Internaute veut aller plusloin comme le montre le succĂšs des de-mandes de crĂ©dit en ligne. Les Ă©tablis-sements financiers s’adaptent Ă  cettenouvelle demande mais peinent Ă prendre en compte un besoin plus hu-main d’implication que permettent lesplateformes de rĂ©seau social (Face-book). Le monde du financement de

projets personnels n’échappe pas Ă  lavague.
 Mais aussi s’impliquer dansles projetsLes investisseurs/prĂȘteurs Ă©prouvent lebesoin de donner un sens humain Ă leur investissement (fonds Ă©thiques,Ă©cologiques). Cependant, les produitsproposĂ©s par les institutions finan-ciĂšres classiques rĂ©pondent mal Ă  unenouvelle demande: prĂȘter Ă  des per-sonnes rĂ©elles que l’on peut voir, donton peut suivre le projet
 De nouveauxentrants du monde de la finance sur-fent sur cette tendance pour offrir desservices qui bousculent le monde ducrĂ©dit.

Principe du crédit entreparticuliers sur Internet

Le prĂȘt rĂ©inventĂ© ?Le crĂ©dit entre particuliers est une pra-tique vieille comme le monde. PrĂȘts fa-miliaux, prĂȘts au sein d’une commu-nautĂ©, ce mode de financement estpratique mais n’offre pas le mĂȘme ni-veau de sĂ©curitĂ© que celui d’un prĂȘtbancaire classique. Les services de crĂ©-

par Marc DulebaEnsimag 1984 - Analyste ebusiness chez LCL

Le crédit P2P paraßt anecdotique dans le contexte actuel.

Cette crise financiÚre brutale révÚle la fracture entre une

élite qui joue de mécanismes économiques sophistiqués et

une population désorientée devant leur complexité. Saurons

nous en tirer la leçon et construire un monde économique

viable et compréhensible de tout un chacun ?

CrĂ©dit P2P n’est pas micro financeLe crĂ©dit P2P diffĂšre de la Micro Finance qui a une vocation plus sociale. Le crĂ©ditP2P est un crĂ©dit classique pouvant financer n’importe quel type de projet (jusqu’àquelques milliers d’euros sur quelques annĂ©es), alors que La micro finance estl'offre de services financiers basiques Ă  des pauvres qui n'ont pas accĂšs au sys-tĂšme bancaire classique, leur permettant ainsi d'amĂ©liorer leurs conditions de vie :les prĂȘts consentis sont de l’ordre de 10 euros sur 6 Ă  12 mois. (d’aprĂšs www.baby-loan.org)

I-MAG - NOVEMBRE 2008

MMaarrcc DDuulleebbaa

Du développement de logiciels telecom au marketing

Internet en passant par la direction de projets, je suis

aujourd'hui analyste ebusiness chez LCL, en charge

de l'innovation et des nouveaux usages de la Banque sur

Internet. J'observe et analyse les innovations techno-

logiques et les tendances sociétales dans cet univers en

perpétuelle évolution. J'anime aussi un club de foot

pour les jeunes un samedi sur deux. « L'important

n'est pas d'ĂȘtre sur le palet mais lĂ  oĂč le palet sera «

Proverbe de Hockey Suédois.

Page 23: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 21

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

dit P2P mettent en relation des em-prunteurs et des prĂȘteurs via un siteweb spĂ©cialisĂ© qui permet de :‱ Proposer des taux attractifs pour

l’emprunteur et le prĂȘteur‱ Simplifier les formalitĂ©s (mettre en

place le crédit, les prélÚvements, lesremboursements)

‱ Limiter les intermĂ©diaires et lesfrais (e.g. supprimer l’intermĂ©diairede la banque)

Le montant et le taux du prĂȘt est (oupeut ĂȘtre) dĂ©terminĂ© par un systĂšmed’enchĂšres. Le prĂȘt est gĂ©nĂ©ralementĂ©tabli entre un emprunteur et un en-semble de prĂȘteurs afin de minimiserle risque de non recouvrement. Leservice de crĂ©dit P2P se rĂ©munĂšre viaune commission sur les transactions(en pourcentage du montant em-pruntĂ©).Suivons le parcours de l’emprunteuret du prĂȘteur sur une plateforme decrĂ©dit P2P.

Vous ĂȘtes emprunteur ? DĂ©crivez votre projet

1. Vous, emprun-teur, dĂ©crivezvotre projet enprĂ©cisant l’objec-tif, le montantdemandĂ©, le tauxd’intĂ©rĂȘt maxi-mal que vous ac-ceptez de payer.Les informationscomplĂ©mentairessur vos revenus,votre anciennetĂ©sur le site ouvotre taux d’en-dettement per-mettront de ras-

surer un prĂȘteur potentiel sur votrecapacitĂ© Ă  rembourser cet emprunt. 2. La plate-forme analyse le marchĂ©des prĂȘts et dĂ©termine quels prĂȘtssont les mieux adaptĂ©s Ă  votre offred’emprunt. Si des prĂȘts sont suscep-tibles de coĂŻncider avec votre offred’emprunt, la plate forme vous prĂ©-vient. 3. Vous choisissez quels prĂȘts voussouhaitez prendre et envoyez uneconfirmation. Le prĂȘteur est alorsprĂ©venu et confirme ou non votreoffre. Une barre de progression vouspermet de visualiser l’état d’avance-ment du projet en fonction des pro-positions des prĂȘteurs. Le projet estprĂ©sentĂ© pour une durĂ©e limitĂ©e Ă quelques jours et peut dĂ©boucher ounon sur une offre de prĂȘt. 4. Lorsque le montant des proposi-tions de prĂȘt atteint la somme quevous demandez, le contrat de prĂȘt estsignĂ©, les paiements associĂ©s sontmis en place.

Vous ĂȘtes prĂȘteur ? Choisissez votreinvestissementSur la plate forme,vous, prĂȘteur/inves-tisseur, Ă©lisez vos pro-jets :1. Vous parcourez laliste des projets etvous choisissez ceuxdans lesquels vousvoulez investir en

fonction de la nature du projet, de lasituation financiĂšre des emprunteurs,du taux qu’ils souhaitent obtenir ainsique de leur score de crĂ©dit.2. Vous faites une offre, si vous pensezque l’emprunteur peut rembourser soncrĂ©dit. vous choisissez alors le mon-tant Ă  prĂȘter ainsi que le taux de rĂ©mu-nĂ©ration de votre placement. Ne soyezpas trop gourmand sinon votre offren’aboutira pas.3. Les offres de prĂȘt qui proposent letaux le plus bas sont sĂ©lectionnĂ©es Ă la date de fin fixĂ©e pour le projet quidure de 5 Ă  10 jours. S’il n’y a pasassez d’offres pour couvrir le montantdu projet, le prĂȘt ne se fera pas.4. Une fois votre argent ainsi placĂ©,vous pouvez voir quelle somme vousprĂȘtez et Ă  qui, ainsi que la somme quireste Ă  investir.Vous reversez une commissionannuelle de l’ordre de 1% du montantinvesti via le service P2P.

Pour mieux emprunter, groupez-vous !Certains services de crĂ©dit P2P per-mettent de dĂ©finir des communautĂ©sd’emprunteurs (ex : Ă©tudiants asia-tiques de Californie ou les femmesentrepreneurs de Seattle) et ainsi defaire bĂ©nĂ©ficier leurs membres d’unemeilleure note de rĂ©putation qui estsynonyme de confiance accrue dansl’emprunteur et donc un taux plusavantageux pour ce dernier.Les facteurs dĂ©terminants pour la rĂ©us-site d’un projet de prĂȘt sont, dansl’ordre dĂ©croissant (cf. [5]) : la note decrĂ©dit, les informations personnellesdĂ©taillĂ©es (sources de revenus, budgetmensuel) l’explication claire du projetet enfin l’appartenance Ă  un grouped’emprunteurs et la note de rĂ©putationassociĂ©e.

Mais comment gĂ©rer le risque ?Ces plates-formes sont sĂ©duisantespour les investisseurs (meilleure rĂ©mu-nĂ©ration) et les emprunteurs (meilleurtaux d’intĂ©rĂȘt), cependant rien negarantit au prĂȘteur qu’il sera entiĂšre-ment remboursĂ© ! Le prĂȘteur porte entiĂšrement le risque.

Page 24: Novembre 2008 i-mag

I-MAG - NOVEMBRE 200822

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

La plate-forme n’est qu’un intermĂ©-diaire. Pourtant le taux de dĂ©faillance(non paiement) est trĂšs faible.Pourquoi ? Les plates- formes nesont, contrairement Ă  la lĂ©gende, pasouvertes aux mauvais payeurs ! EllessĂ©lectionnent les emprunteurs ayantun bon score FICO (obligatoire auxUSA). De plus, la pression des « pairs» (via les groupes entre autres) induitune plus grande responsabilisationde l’emprunteur.

Premier retour d’expĂ©rience

‱ 
OĂč les banques s’invitentZOPA a dĂ©marrĂ© son service aux USAen s’alliant Ă  5 Credit Unions (banquemutualiste Ă©tasunienne) pour distri-buer leurs certificats de dĂ©pĂŽt. En choi-sissant de se dĂ©marquer du modĂšleclassique du leader PROSPER, ZOPAUSA parie sur un modĂšle d’affaire hy-bride puisqu’il s’agit de proposer desproduits garantis mais en servant untaux de rĂ©munĂ©ration plus faible. Cettesymbiose entre banques tradition-nelles et nouveaux entrants introduitune dĂ©clinaison intĂ©ressante du mo-dĂšle. En Europe, ABN AMRO, une desprincipales banques des Pays Bas vientde proposer un service de crĂ©dit P2P(offline) Ă  ses clients.‱ 
 Quelques ratĂ©s 
Lending Club (USA) a arrĂȘtĂ© temporai-rement ses activitĂ©s aprĂšs un an, fauted’ĂȘtre profitable. IOU Central (Canada)a du suspendre ses activitĂ©s pour seconformer Ă  la lĂ©gislation locale. Cestoussotements sont inĂ©vitables dans l’ex-ploration d’un nouveau marchĂ©. Mais,dans le mĂȘme temps, ZOPA etPROSPER ont doublĂ© le nombre deleurs abonnĂ©s avec, il est vrai, unemodeste croissance des prĂȘts(+15%), car Ă  peine 10% des pro-jets de prĂȘt se concrĂ©tisent (cf. [8]).‱ 
 Mais une soliditĂ© du modĂšleL’épreuve de la crise des crĂ©dits hypo-thĂ©caires (subprimes) a conduit lesbanques Ă  resserrer leur offre decrĂ©dit et pourtant les plates-formesP2P n’ont pas connu de dĂ©faillancemajeure. Si la forme et les variantesdu modĂšle peuvent encore Ă©voluer,

le cƓur du principe semble solide.

Une offre trĂšs diversifiĂ©eLes plates-formes de crĂ©dit P2P cou-vrent un spectre trĂšs large allant de laplate-forme Ă  but non lucratif (projetshumanitaires de KIVA par exemple)aux plates-formes mercantiles commePROSPER ou ZOPA qui sont adossĂ©es Ă des fonds de Capital Risque bienconnus. Leur management est issu dumonde de l’Internet et de la Finance.Certaines plates-formes favorisent lecontact entre leurs membres en les in-citant Ă  crĂ©er une communautĂ©, alorsque d’autres prĂ©fĂšrent se prĂ©sentercomme un service neutre et anonymed’investissement et de prĂȘt.

L’Europe et la France Ă  l’abri? L’Europe commence Ă  ĂȘtre investie :ZOPA est prĂ©sent en Grande Bretagneet Italie, Boober aux Pays Bas. Mais lemarchĂ© français possĂšde des spĂ©cifici-tĂ©s qui le rendront difficile Ă  pĂ©nĂ©trer :

1. La rĂ©glementation Française ac-tuelle est un obstacle : seuls desĂ©tablissements de crĂ©dit peuventeffectuer des opĂ©rations debanques Ă  titre habituel (Code mo-nĂ©taire et financier). Le prĂȘt entreparticuliers est trĂšs encadrĂ© enFrance.2. Les Français sont peu endettĂ©set peu appĂ©tant au crĂ©dit (2 foismoins que la moyenne EuropĂ©enne)([2] et [3]).3. Le marchĂ© est trĂšs concurrentiel,les taux sont faibles (les taux d’in-tĂ©rĂȘt proposĂ©s aux USA par cer-

tains Ă©tablissements de crĂ©dit sont in-imaginables en France : ils dĂ©passentle taux de l’usure!).4. La notation systĂ©matique de l’em-prunteur (score FICO) n’a pas d’équi-valent en France oĂč seuls les dĂ©fauts decrĂ©dit sont notĂ©s. Or c’est un Ă©lĂ©mentdĂ©terminant pour la plate-forme.Mais le contexte rĂ©glementaire Euro-pĂ©en est en pleine Ă©volution et un telservice apparaĂźtra tĂŽt ou tard en Franceen s’adaptant aux spĂ©cificitĂ©s nationales.

Un marché naissant qui seconstruit

Plus de 20 services de crĂ©dit P2P sontopĂ©rationnels dans le monde en 2008et plusieurs lancements sont prĂ©vus pour2008/2009 (CommunityLend parexemple). PROSPER, le leader aux USAtraite $100 millions de prĂȘts personnels.Selon le cabinet Celent cette forme decrĂ©dit devrait reprĂ©senter 10% dumarchĂ© bancaire en 2010 : Un marchĂ©

prometteur mais encore naissant. Les opĂ©rateurs de crĂ©dit P2P consti-tuent-ils une menace pour lesbanques traditionnelles ? Oui, si lesbanques n’évoluent pas. Les plates-formes de crĂ©dit P2P vont proba-blement grignoter le marchĂ© des crĂ©-dits de « petit » montant. Pour desinstitutions financiĂšres agiles, lecrĂ©dit P2P constitue une opportu-nitĂ© d’élargissement de services.Innovation de rupture, ces servicesde crĂ©dit P2P peuvent dĂ©placer lesfrontiĂšres du marchĂ© du crĂ©dit enrĂ©Ă©quilibrant le pouvoir en faveur du

Page 25: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 23

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

consommateur
 Mais si des acteursindépendants prospÚrent et prennentun poids significatif, cela ne risque-t-il pas de poser un problÚme de régu-lation ?

Références

[1] « Financial Services 2.0 », DeutscheBank Research, aout 2006

[2] « L’accĂšs des mĂ©nages au crĂ©diten France «, Rapport du SĂ©nat,JoĂ«l Bourdin, mars 2006

[3] « Le marché du crédit à la consom-mation en Europe », SOFINCO,Nicolas Pecourt, juillet 2007

[4] « Peer-to-peer lending, Crunchlesscredit » The Economist, Oct 25th2007

[5] « The democratization of perso-nal consumer loans ?.. »M.Herzenstein, R.L.Andrews,U.M.Dholakia, E.Lyandres,University of Delaware, Rice

TH È M E D U P RO C H A I N N U M É RO

Green ITRĂ©dacteur :

Georges Allemand, Ensimag 1986,

Directeur de projet, AtosOrigin

Page 26: Novembre 2008 i-mag

I-MAG - NOVEMBRE 200824

Wikio est un portail d'information de nouvelle génération, et unservice shopping associé. Basé sur la technologie RSS (Real Simple Syndication), et desalgorithmes sémantiques (analyse de texte par extraction deconcepts), Wikio facilite la navigation dans les informations pro-duites par les medias et les meilleurs blogs.Seuls les blogs de qualité sont indexés par Wikio, et la totalitédes médias. Le service s'adresse au grand public autant qu'auxinternautes avancés, gros consommateurs d'information.Grùce à sa technologie d'analyse sémantique et d'analyse desliens hypertextes, Wikio fait ressortir automatiquement les ten-dances des informations, des discussions blogosphÚriques, ouencore les vidéos ou les produits les plus buzzés sur Internet.Wikio comporte aussi un moteur de recherche spécialisé pourla recherche d'informations dans les blogs, les medias, les vidéoset les produits. Pour les internautes désireux de publier un article directement(tout le monde n'a pas un blog), le site dispose aussi d'une pla-teforme de publication collective. Enfin, le classement des blogs les plus influents publié par Wikiofait référence dans la blogosphÚre (c'est un excellent moyen dedécouvrir le monde des blogs!).

Des technologies avancées ren-dues accessibles pour tous

Wikio, dont l'index est constituĂ© par les flux RSS des medias etdes blogs rĂ©fĂ©rencĂ©s, propose un lecteur de flux RSS dĂ©barrassĂ©de toute complexitĂ© technique: pour recevoir automatiquementle flux d'informations d'un media ou d'un blog, il suffit de cliquersur le lien 's'abonner' placĂ© sous le titre de n'importe quel article.L’abonnement est gratuit bien sĂ»r. De mĂȘme, vous pouvez rece-voir toutes les informations publiĂ©es sur un sujet particulier quivous intĂ©resse, (faites une recherche sur le mot clĂ© correspon-

dant, puis cliquez sur le bouton “s'abonner”) Vous crĂ©ez ainsides pages d'informations personnelles, pour suivre en perma-nence les sujets ou les sources qui vous intĂ©ressent. Cette notion de personnalisation de l'information va plus loin:des pages personnelles d'information plus sophistiquĂ©es peu-vent ĂȘtre crĂ©es sur n'importe quel sujet, avec l'assistance d'unsystĂšme de suggestions dynamiques.

Shopping: agrégation de toutes lesinformations sur les produits

Les technologies développées pour l'analyse de l'informationpermettent aussi à Wikio d'offrir un service shopping trÚs utilepour le consommateur, en agrégeant toutes les informations dis-ponibles sur le Net sur chaque produit: articles, tests, avis deconsommateurs, photos du produit, vidéos, et bien sûr offresdes marchands en ligne. Ce service shopping complÚte le modÚleéconomique de Wikio. Une entreprise dans le secteur de l'infor-mation comme Wikio ne peut pas vivre que de l'information ...En effet, la publicité ne rapporte pas assez, car le service - entiÚ-rement gratuit, et produit en 5 langues - est coûteux à produire,avec une équipe de 35 personnes. Il faut des services associéscomme le shopping pour rentabiliser l'investissement.

Une ambition européenne, voiremondiale

A peine plus de deux ans aprĂšs son lancement, Wikio est dĂ©jĂ  uti-lisĂ© par 3 millions de français (www.Wikio.fr) et le double d'eu-ropĂ©ens. Un site amĂ©ricain a Ă©galement Ă©tĂ© lancĂ©. Le Web 2.0permet Ă  de jeunes entreprises Internet de se dĂ©velopper Ă l'Ă©chelle internationale, et le secteur de l'information qu'a choisiWikio est sans aucun doute l'un de ceux oĂč il y a le plus Ă  inven-ter.

S’il est un entrepreneur français symbole de l’internet, c’est bien Pierre Chappaz,cofondateur de Kelkoo et ardent dĂ©fenseur du web 2.0 sur son blog, qui figure rĂ©-guliĂšrement dans le top 20 français. Wikio, le service d’information qu’il a crĂ©Ă©,est un exemple parfait d’application au quotidien des principes du web 2.0, quipeut ĂȘtre vu comme une plateforme informatique Ă  part entiĂšre, fournissant desapplications web aux utilisateurs, Ă  travers des technologies mĂ»res que se sont ap-propriĂ©es les dĂ©veloppeurs, en particulier de RSS. Dans ce court article, Pierrenous donne un peu plus de dĂ©tails sur ce service. Jean-Marc Darrigol.

Wikio, un portail d'information 2.0par Pierre Chappaz, centralien, fondateur de Kelkoo puis de Wikio

Page 27: Novembre 2008 i-mag
Page 28: Novembre 2008 i-mag

L’Internet mobile

I-MAG - NOVEMBRE 200826

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Evolution technique de l’Internetmobile !

Il y a bientĂŽt une dizaine d’annĂ©es,malgrĂ© des terminaux monochromeset une navigation via des pages WAPformatĂ©es pour de tous petits Ă©crans,nombreux Ă©taient ceux qui pariaientsur un dĂ©veloppement rapide et gĂ©nĂ©-ralisĂ© de l’accĂšs aux informations etaux sites mobiles depuis son tĂ©lĂ©-phone. Dans les faits, les limitations enperformance et les coĂ»ts ont gĂ©nĂ©rĂ© denombreuses dĂ©ceptions et une adop-tion plus lente et moins massive queprĂ©vue. On retiendra tout de mĂȘme lesuccĂšs de l’i-mode, extrĂȘmement po-pulaire au japon et qui a trouvĂ© son pu-blic Ă©galement en Europe.Au fil des annĂ©es, les paramĂštres del’internet mobile ont changĂ©, et toutsemble maintenant rĂ©uni pour quel’adoption aille en s’accĂ©lĂ©rant. Pours’en rendre compte, un tĂ©moin emblĂ©-matique de ce changement est apparu

en 2007, il s’agit de l’iPhone. Avec ceterminal et ses forfaits associĂ©s, Appleet les opĂ©rateurs n’ont pas inventĂ© l’in-ternet mobile, mais cela a incarnĂ© etincontestablement accĂ©lĂ©rĂ© le change-ment qui s’opĂ©rait dans ce domaine.Ainsi, la limitation liĂ©e au terminal lui-mĂȘme est en train d’ĂȘtre rĂ©duite peu Ă peu au fur et Ă  mesure des progrĂšs surles rĂ©solutions d’écran, sur l’interfaceutilisateur (via les Ă©crans tactiles et cla-viers miniaturisĂ©s) et enfin sur laconsommation Ă©lectrique. Les smart-phones, qui ont remplacĂ© les PDA pourl’accĂšs mobile Ă  Internet, proposentdes Ă©crans d’une dimension et d’unerĂ©solution croissante. Des rĂ©solutionsde 320 x 240 pixels voire VGA (640 x480) ne sont plus rares. Il devient ainsipossible d’afficher Ă  l’écran de maniĂšrelisible une portion d’une page Internetstandard, voire une page complĂšte.L’iPhone (rĂ©solution de 320 x 480) a luiproposĂ© le premier navigateur embar-quĂ© (Safari) qui soit capable d’afficher

Par Laurent GatignolEnsimag 1994 - Directeur exécutif de Kelkoo France

L’Internet mobile, Ă  savoir l’accĂšs au rĂ©seau Internet depuis un terminal autre qu’une ma-chine type PC et via une liaison non fixe, a fait naĂźtre Ă  la fin des annĂ©es 90 et au dĂ©but desannĂ©es 2000 de grands espoirs puis des dĂ©ceptions. Aujourd’hui, on est loin des prĂ©misses etpromesses, les liaisons proposent un dĂ©bit en constante augmentation et les terminaux sontde plus en plus sophistiquĂ©s, Ă  l’image de l’iPhone d’Apple, emblĂšme de cette Ă©volution.En pa-rallĂšle, les services associĂ©s devront suivre l’évolution des terminaux et des dĂ©bits et s’adap-ter Ă  de nouveaux usages pour le mobile connectĂ©.

LLaauurreenntt GGaattiiggnnoollPassionnĂ© de mobilitĂ© et Ă©diteur de plusieurs blogset sites web dans le domaine, Laurent Gatignol, fraĂź-chement diplĂŽmĂ© de l’Ensimag en 1994, dĂ©bute sacarriĂšre chez Microsoft France avant de rejoindrele dĂ©partement TĂ©lĂ©com de Sema Group oĂč il assurela direction de projets notamment pour FranceTĂ©lĂ©com.ArrivĂ© en 2000 chez Kelkoo France, il prend encharge la direction technique France, lance les sitesBelges, il travaille plus rĂ©cemment Ă  la stratĂ©gieeuropĂ©enne des Ă©quipes de dĂ©veloppements locales,lance le service Kelkoo mobile en 2007 en Francepuis en 2008 en Europe. Laurent est dĂ©sormaisDirecteur ExĂ©cutif de Kelkoo France.

Page 29: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 27

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

une page web complĂšte avec unecompatibilitĂ© HTML semblable Ă  celled’un navigateur bureautique type In-ternet Explorer ou Firefox. Mieux en-core, il permet un zoom rapide surune portion de la page, nĂ©cessairepour la lisibilitĂ© sur un terminal detaille rĂ©duite et est compatible avecles technologies regroupĂ©es sous leterme Ajax, utilisĂ©es sur les sites webrĂ©cents (web 2.0). Cela permet l’utili-sation de Webapps, vĂ©ritables appli-cations connectĂ©es, proposant uneinterface riche et ne nĂ©cessitant pasde recharger la page. D’autres naviga-teurs empruntent une voie semblableen terme de visualisation, citons no-tamment Opera mobile sous Win-dows Mobile et Nokia S60. Pour l’in-ternaute, c’est la garantie d’un accĂšsĂ  l’ensemble des sites Internet. Pourles Ă©diteurs de sites, cela signifie queleur site standard est lisible par desterminaux mobiles, lĂ  oĂč auparavantune version dĂ©diĂ©e devait ĂȘtre prĂ©-vue, augmentant les coĂ»ts, les ver-sions et la maintenance.L’autre limitation concernait la fai-blesse des dĂ©bits de donnĂ©es et doncle temps d’attente engendrĂ© pourl’utilisateur. Pour pouvoir afficher despages de sites standards, il est vital dedisposer d’un dĂ©bit suffisant. AprĂšs leGPRS puis le Edge(2G), le lancementdes rĂ©seaux de troisiĂšme gĂ©nĂ©ration(3G /UMTSet 3G+/ HSPDA), capablesd’atteindre des dĂ©bits de plusieursMbit/s, offrent dĂ©sormais le cadretechnique suffisant pour un vĂ©ritableconfort d’utilisation de l’Internet mo-bile. En parallĂšle, les terminaux sontde plus en plus Ă©quipĂ©s de la techno-logie sans-fil WiFi.Mais l’aspect technique n’est pas suf-fisant, restait en effet le paramĂštre ducoĂ»t de connexion. Pour faire uneanalogie avec l’Internet fixe : qui n’apas apprĂ©ciĂ© le passage d’un Internetpar liaison tĂ©lĂ©phonique RTC, facturĂ©souvent Ă  la minute de connexion, Ă l’ADSL ou la connexion devenait illi-mitĂ©e et permanente ? Le mĂȘmechangement est en cours pour lesconnexions mobiles. Les forfaits pro-posant du ‘data illimité’, selon le jar-

gon des opĂ©rateurs, sont en train dese gĂ©nĂ©raliser. En France, SFR avecles forfaits Illimythics, mais Ă©gale-ment Orange avec ses forfaits iPhone(qui a Ă©tĂ© l’un des premiers termi-naux commercialisĂ© aux Etats-Unisavec un forfait donnĂ©es illimitĂ©es) of-frent la possibilitĂ© d’ĂȘtre connectĂ© enpermanence Ă  Internet via son tĂ©lĂ©-phone mobile, pour un surcoĂ»td’abonnement forfaitaire et non plusfacturĂ© Ă  la quantitĂ© de donnĂ©esĂ©changĂ©es.

Mixez un dĂ©bit consĂ©quent, uneconnexion permanente et des termi-naux offrant un confort d’utilisationet de visualisation suffisant, et vousavez l’environnement parfait pourl’adoption croissante de l’Internetmobile. Reste Ă  savoir ce que les utili-sateurs attendent et ce que les opĂ©ra-teurs et les Ă©diteurs de sites peuventproposer

Usage de l’Internet mobile

IDC compte en 2008 pas moins de546 millions d’utilisateurs de mobilesconnectĂ©s Ă  Internet, soit le doublede 2006. En 2012, le nombre de mo-biles connectĂ©s Ă  Internet sera supĂ©-rieur au nombre d’ordinateurs per-sonnels connectĂ©s. Il est alors lĂ©gi-time de se poser la question de ceque font et feront les « mobinautes ».Les usages du mobile dans le grandpublic sont actuellement liĂ©s Ă  la re-cherche d’information : actualitĂ©,sport, mĂ©tĂ©o, bourse. On trouve doncdes moteurs spĂ©cialisĂ©s pour mobile,Ă©ditĂ©s par les grands de la recherche

mondiale que sont Google (avec desversions mobiles de ses services) ,Ya-hoo ! (avec OneSearch) ou MSN. Laconsultation d’email et la messagerieinstantanĂ©e figurent Ă©galement dansles usages les plus dĂ©veloppĂ©s actuel-lement.Les tendances gĂ©nĂ©rales de l’Internet« classique » devraient Ă©galementavoir leur Ă©quivalent sur le mobile.Ainsi, le « m-commerce », encore peudĂ©veloppĂ© faute de sites marchandscompatibles, devrait progresser,poussĂ© par des terminaux perfor-mants permettant de surfer et d’ache-ter depuis son mobile mais Ă©gale-ment par le dĂ©veloppement croissantdu nombre de sites marchands adap-tĂ©s Ă  l’utilisation depuis un mobile.En 2007, ce sont plusieurs sites e-commerce français d’importance quiont lancĂ© une dĂ©clinaison mobile deleur site : Voyages-sncf, Alapage, Fnacou encore Kelkoo.La dimension sociale du web actuel(web dit « 2.0 ») devrait trouver unprolongement naturel et mĂȘme s’en-richir avec le mobile. Ainsi, tenir sonblog depuis son mobile, le «moblog-ging », faire du « microBlogging » (en-voi de textes courts vers son rĂ©seaud’amis avec des applications typeTwitter) voire du « photoblogging » enenvoyant directement ses clichĂ©s enligne, en temps rĂ©el et de maniĂšregĂ©o-localisĂ©e (grĂące Ă  la prĂ©senced’un GPS embarquĂ© de plus en plusgĂ©nĂ©ralisĂ©) sont des utilisations enplein essor. Bien entendu, l’outil mo-bile, portĂ© sur soi et connectĂ© en per-manence devrait ouvrir la voie Ă  desservices liĂ©s Ă  la gĂ©o-localisation telsle signalement de boutiques, restau-rants, centres d’intĂ©rĂȘts mais aussirencontres liĂ©s au lieu oĂč l’on setrouve. On peut anticiper Ă©galement que lemobile, au delĂ  du mail, servira Ă  re-trouver sur son petit Ă©cran, oĂč quel’on soit, l’ensemble de son universnumĂ©rique personnel. Celui-ci, stockĂ©sur des serveurs accessibles au choixdepuis son ordinateur de bureau oudepuis son mobile permettra aux do-cuments, photos, musique et vidĂ©os

Page 30: Novembre 2008 i-mag

I-MAG - NOVEMBRE 200828

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

d’ĂȘtre accessibles en permanence. Enfin, selon IDC, dans les annĂ©es Ă  ve-nir, avec l’augmentation des dĂ©bits etla rĂ©duction des coĂ»ts, la consomma-tion de contenu multimĂ©dia (musique,vidĂ©os et sonneries), devrait-elle deve-nir prĂ©dominante depuis les mobiles.En attendant, les Ă©diteurs de sites mo-biles doivent continuer Ă  composeravec des dĂ©bits variables et un parc determinaux hĂ©tĂ©rogĂšnes. Tous les termi-naux en circulation ne proposant pasune navigation intuitive et Ă  la compa-tibilitĂ© avancĂ©e, il est raisonnable dedĂ©ployer des sites dans un format li-sible par une majoritĂ© de mobiles. Unenorme basĂ©e sur XHTML (voire la rĂ©-cente XHTMLBasic 1.1) permet de pro-poser un Internet mobile compatibleavec la plus grande variĂ©tĂ© de termi-naux. Il convient Ă©galement de veiller Ă conserver un poids des pages le plusrĂ©duit possible, une taille et une quan-titĂ© d’images rĂ©duites au strict nĂ©ces-saire tout en travaillant Ă  inventer desapplications mobiles connectĂ©es deplus en plus ambitieuses. Elles de-vraient pouvoir trouver un finance-ment avec la publicitĂ©, qui va bien en-tendu accompagner l’augmentation del’audience et des usages mobiles.

❃

AAlleexxaannddrree BBoouuttiinnDiplÎmé de l'Ensimag en 1989, je travaille sur la région parisienne pendant 9 ans pour différentes entreprisesau développement de logiciels embarqués civils et militaires. Durant cette période, j'occupe les postes de déve-loppeur, chef de projet et chef de produit. En 1998, je rejoins une société de service en informatique Grenobloisepour devenir Directeur France des réalisations au forfait (avant-vente et réalisation - Département de 140 per-sonnes en 2003). Je contribue également à l'obtention de certifications ISO9001 et CMMi. Début 2004, jerejoins Yahoo pour manager les équipes de développement (70 personnes à Grenoble), implémenter des méthodeset outils pour les développeurs et unifier le processus de développement logiciel pour les équipes locales puis auniveau Européen. Enfin, en 2006, je suis muté dans l'équipe stratégie internationale pour définir et implémen-ter un processus de développement logiciel commun à l'Europe, l'Asie et l'Inde. DÚs cette époque je commence àme documenter sur les méthodes agiles, me forme pour devenir "Scrum Practitioner", devient préconisateur etcoach agile en interne, tout en contribuant à la communauté Agile mondiale en présentant mon retour d'expériencelors des conférences de Londres (2007) et Toronto (2008).

L’AgilitĂ© au Service du Web

par Alexandre BoutinEnsimag 1989Agile Coach – Pratiquant Scrum CertifiĂ© – www.agilex.fr

Les approches dites ‘Agile’ ont vraiment le vent en poupeces derniĂšres annĂ©es car elles offrent une alternative rĂ©a-liste et plus efficace Ă  l’approche basĂ©e sur des ‘Cycle en V’associĂ©e Ă  un rĂ©fĂ©rentiel normatif plus ou moins complexe(ISO, CMMi 
).Cet article vous Ă©clairera sur les raisons qui font des entre-prises du Web les leaders mondiaux incontestĂ©s des pra-tiques Agile.

Page 31: Novembre 2008 i-mag

I-MAG - NOVEMBRE 2008 29

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

Les approches dites ‘Agile’

Les approches Agile sont toutes basĂ©essur le « Manifeste Agile » qui dĂ©finit lesprincipes de commun Ă  toutes les mĂ©-thodes de dĂ©veloppement dites Agile(www.agilemanifesto.org). Les plusconnues et utilisĂ©es sont SCRUM et XP,mais d’autres mĂ©thodes telles queDSDM, RAD ou CRYSTAL ont Ă©gale-ment leur fervents supporters.Une façon simple, quoique restrictive,pour apprĂ©hender les approches Agileest d’analyser les valeurs partagĂ©es parces approches.

Les valeurs de l’agilitĂ©

L’agilitĂ© se reconnait dans les valeursde gauche (en vert) plutĂŽt que les va-leurs de droite (en bleu). Cela ne veutpas dire que les valeurs de droite sontde mauvaises valeurs mais simplementque pour tirer le maximum de bĂ©nĂ©-fices de l’agilitĂ©, il faut faire des choixet donc accepter de sacrifier certainsavantages apportĂ©s par les valeurs dedroite pour en obtenir beaucoup plusdes valeurs de gauche.Personnes et InteractionsL’AgilitĂ© considĂšre que le facteur hu-main est une plus grande source desuccĂšs que les moyens matĂ©riels ou lesprocĂ©dures. Il est prĂ©fĂ©rable d’avoirune Ă©quipe soudĂ©e, et qui commu-

nique beaucoup en toute confianceplutĂŽt que des individualistes mĂȘmebrillants Un processus dĂ©taillĂ© ne garantit qu’unminimum (ce qui est dĂ©crit par le pro-cessus) qu’un groupe se limitera sou-vent Ă  produire. A l’opposĂ©, une Ă©quipeagile aura Ă  cƓur de dĂ©passer les li-mites individuelles en s’entraidant et laperformance finale sera bien souventau-delĂ  des espĂ©rances initiales.Logiciel qui fonctionneL’utilisateur final sera satisfait unique-ment si le produit qu’il utilise est fonc-tionnel, et il n’y a rien de mieux qued’avoir en permanence un produitfonctionnel pour s’assurer que le pro-duit final le sera Ă©galement.Pour l’AgilitĂ©, l’effort doit ĂȘtre portĂ© surle produit qui fonctionne plutĂŽt que surles artefacts qui y sont associĂ©s (dont ladocumentation). Par exemple, il vautmieux commenter le code que de rĂ©di-ger un document de conception dĂ©-taillĂ©e trĂšs couteux Ă  maintenir. DemĂȘme, la distribution des compĂ©-tences au sein de l’équipe est lameilleure garantie de faire perdurer laconnaissance.Collaboration avec le clientLa contractualisation est liĂ©e Ă  l’inquiĂ©-tude du client de ne pas recevoir unproduit conforme Ă  ses attentes etdonc il dĂ©finit le dĂ©tail de ce qu’il at-tend au risque de ne plus pouvoir chan-

ger d’avis en fonction de l’évolution deson marchĂ©.Pour l’AgilitĂ©, le client doit ĂȘtre impli-quĂ© dans le dĂ©veloppement du produitafin que ses besoins, mĂȘme ceux nonidentifiables au dĂ©marrage, soient sa-tisfaits. La notion de client et de four-nisseur s’estompe pour devenir unecollaboration basĂ©e sur un respect mu-tuel et une confiance rĂ©elle.Adaptation au changementLors de l’utilisation d’une premiĂšre ver-sion d’un produit, nous fourmillonstous d’idĂ©es nouvelles ou de modifica-tions des besoins initiaux. Si telle est larĂ©alitĂ©, pourquoi la nier ?Pour l’AgilitĂ©, le changement est nor-mal et bienvenu, car le suivi d’un planĂ©tabli Ă  l’avance est moins efficace quela re-planification rĂ©guliĂšre en fonctiondes nouvelles informations dispo-nibles. Mais pour ce faire il est nĂ©ces-saire que la structure du logiciel et lamĂ©thode de production de ce logicielsoient flexibles.

Le Web : Leader Agile

Les Ă©tudes actuelles faites par le cabi-net Forrester montrent que toutes lesgrandes sociĂ©tĂ©s du Web font partiedes leaders mondiaux de l’AgilitĂ©, encompagnie de grands groupes tels queBritish Telecom et Borland.Ce constat s’explique par l’aisance dessociĂ©tĂ©s du Web Ă  implĂ©menter plus ra-pidement et facilement les valeurs del’AgilitĂ© que d’autres entreprises.

Qui voudraitne pas ĂȘtreAgile ?

Personnes et InteractionsLe Web est un endroit idéal pour créerune nouvelle société car pour un inves-tissement raisonnable (des machines

Personnes et interactions

Logiciel qui fonctionne

Collaboration avec le client

Adaptation au changement

Processus et outils

Documentation

NĂ©gociation Ă  partird’un contrat

Suivi d’un plan

MMMM AAAA NNNN IIII FFFF EEEE SSSS TTTT EEEE AAAA GGGG IIII LLLL EEEE :::: VVVV AAAA LLLL EEEE UUUU RRRR SSSS

>

>

>

>

Page 32: Novembre 2008 i-mag

dd oo ss ss ii ee rr AA LL’’HHEEUURREE DDEE LL’’IINNTTEERRNNEETT GGLLOOBBAALL

et quelques concepteurs) vous pouvezaccĂ©der Ă  des millions de clients. Unestartup du Web met l’accent sur l’espritd’équipe et des personnes polyvalentesplutĂŽt que sur des processus Ă©tablis.Cette façon de faire est une valeurAgile qui reste profondĂ©ment ancrĂ©edans les esprits, mĂȘme lorsque la so-ciĂ©tĂ© est amenĂ©e Ă  grandir du fait de sarĂ©ussite. Logiciel qui fonctionneUne autre caractĂ©ristique des sociĂ©tĂ©sdu Web est leur maĂźtrise complĂšte dudĂ©ploiement du produit final chez leclient qui paye lui-mĂȘme la connexionpour y accĂ©der. A l’opposĂ©, un logicielde tĂ©lĂ©phone portable se dĂ©ploie sur unmatĂ©riel physique et il faut avion pourembarquer un calculateur de vol avecson logiciel.Les sociĂ©tĂ©s du Web ont donc l’avan-tage de pouvoir vĂ©rifier plus facile-ment, tout au long du dĂ©veloppement,le produit final. Pour ce qui est la documentation, et

sans affirmer qu’elle est inutile, je vousposerais simplement la question :Avez-vous vraiment lu le manuel utili-sateur pour lire les news sur Yahoo.frou acheter sur eBay ?Collaboration avec le clientL’accĂšs direct Ă  l’utilisateur est vrai-ment une grande force du Web. En ef-fet, nul besoin de dĂ©ployer une nou-velle version sur un parc de machinesdans les locaux de vos clients, ce sontles clients qui viennent Ă  vous pourvoir et utiliser les nouveaux produits.Le feedback client est obtenu directe-ment par les « avis utilisateurs » rĂ©digĂ©spar les utilisateurs eux-mĂȘmes ou indi-rectement par l’analyse du taux de frĂ©-quentation du site web avant et aprĂšsla mise en ligne de nouveaux produits. Adaptation au changementLe Web est trĂšs concurrentiel, certainsdiront plus qu’ailleurs, car il n’y a qu’àregarder la rapiditĂ© du succĂšs de cer-tains produits comme Facebook, ou dese souvenir de quels produits Web

Ă©taient utilisĂ©s il y a 10 ans (AltaVista)pour se rendre compte de la vitesse in-croyable de d’évolution du marchĂ© duWeb. Les entreprises du Web ont donc l’ab-solue nĂ©cessitĂ© d’ĂȘtre trĂšs rĂ©actives etde s’adapter sur des dĂ©lais trĂšs courts.

Conclusion

La similitude des valeurs de l’AgilitĂ©avec les valeurs des entreprises du Webexplique en grande partie les raisonsdu succĂšs des mĂ©thodes Agile au seinde ces entreprises.Lorsque votre culture, votre indĂ©pen-dance, vos utilisateurs et votre marchĂ©vous poussent vers l’AgilitĂ©, l’appliquerdevient du bon sens plus que de la stra-tĂ©gie et en devenir les leaders semblenaturel, et si en bonus cela contribue Ă l’amĂ©lioration de votre image demarque, c’est parfait !

❃

Le voyage d’étude est de retour dansla vie associative de l’Ensimag.OrganisĂ© en octobre par le BDE-Entreprise, il a permis Ă  21 Ă©tudiantsde partir Ă  la dĂ©couverte du Maroc.

Lorsque la semaine banalisĂ©e rĂ©servĂ©e auSĂ©minaire CarriĂšres, a Ă©tĂ© supprimĂ©e dansla nouvelle maquette pĂ©dagogique de l'Ă©cole,le BDE-Entreprise a dĂ©cidĂ© de faire renaĂźtrele voyage d’étude - tradition perdue au milieudes annĂ©es 90- et a choisi le Maroc commedestination.Ce pays, qui connaĂźt un fort dĂ©veloppementĂ©conomique couplĂ© Ă  des plans ambitieuxdans de nombreux secteurs (transports, TIC,tourisme, etc.) a Ă©tĂ© choisi aussi pour sa stra-tĂ©gie visant au dĂ©veloppement des activitĂ©soffshore. Les partenariats (dont certains ont Ă©tĂ© Ă©ta-blis avec l'aide de l'AAE et de l'association

AMET) ont permis de visiter 5 sociétés : AtosOrigin (Centre de services de Casablanca) ;GFI Maroc ; Omnidata, (1Úre SSII marocaine

crĂ©Ă©e en 1989 par Monsieur Khalid El Hariry,Ensimag 1987) ; S2M (SociĂ©tĂ© MaghrĂ©binede MonĂ©tique) et l'opĂ©rateur tĂ©lĂ©phoniqueWana. La semaine a comportĂ© une ren-contre avec le Centre d’Investissement deTanger (visite du port Tanger-MĂ©diterranĂ©e, investissement d'un milliard d'euros), ainsiqu'une rĂ©ception au MinistĂšre de l'Industrie,du Commerce, et des Nouvelles Technologies

(prĂ©sentation du plan de dĂ©veloppement desTIC " IMPACT 2013").Les Ă©tudiants ont prĂ©sentĂ© l'Ensimag aulycĂ©e Mohammed V de Casablanca, et ontremis les livres de prĂ©pa rĂ©coltĂ©s avant leurdĂ©part Ă  la bibliothĂšque du lycĂ©e. A l'EcoleNationale SupĂ©rieure d’Informatique etd’Analyse des SystĂšmes, ils ont posĂ© lesbases d’un partenariat entre la Junior-Entreprise de l’Ensimag (NSIGMA) et la futureJunior-Entreprise de l’ENSIAS.Mais parce qu'un voyage d’étude ne serĂ©sume pas au mot "Ă©tude", le petit groupea pleinement profitĂ© de la richesse culturelledu Maroc, notamment dans les villes deMarrakech et de Rabat, et apprĂ©ciĂ© la gas-tronomie au travers de succulents et... inter-minables repas, dont un fameux partagĂ©avec les anciens de Casablanca !L’équipe organisatrice du voyage d’étude

JérÎme Daydé et Aness Meski

Voyage d'Ă©tudes 2008 : destination Maroc

Page 33: Novembre 2008 i-mag

31I-MAG - NOVEMBRE 2008

Un nouveau site emploi pour 2009 !Vous ĂȘtes nombreux Ă  ĂȘtre abonnĂ©s au site emploi del'AAE ENSIMAG, aujourd'hui gĂ©rĂ© par une liste de diffu-sion, et il nous semblait important de rendre ce site plusfonctionnel: capacitĂ©s de recherche par rĂ©gion, mise enplace d'alertes automatiques, etc...Ainsi, dans le cadre des projets 2A (projets pour les Ă©tu-diants ENSIMAG 2Ăšme annĂ©e), l'AAE ENSIMAG a proposĂ©un sujet de refonte du site d'offres d'emploi qui a suscitĂ©un rĂ©el intĂ©rĂȘt auprĂšs des Ă©tudiants car huit d'entre euxont demandĂ© Ă  travailler dessus !Nous avons rĂ©digĂ© les spĂ©cifications du projet puis avecl'aide prĂ©cieuse de Laurent Goujon (ENSIMAG 2003),nous avons suivi l'avancement du projet jusqu'aux soute-nances en juin. Les Ă©tudiants se sont rĂ©partis les rĂŽles surle projet, ont planifiĂ© leur travail, dĂ©veloppĂ© le site et gĂ©rĂ©la QA. Au final, le projet est une rĂ©ussite car ils ont pu livrer unsite fonctionnel qui est en bĂȘta-test jusqu'Ă  la fin de l'an-nĂ©e 2008 pour une mise en production prĂ©vue pour dĂ©-but 2009.Merci Ă  Antoine UBERGER, Olivier BITTINGER, ChristianHUGUES, Damien BRUNEAU, Baptiste LEPERS, MaximOKOROKOV, Bogdan POPA et Ekaterina SHEVELEVApour leur travail, et Ă  Yves Denneulin et Marie Laure Po-tet pour l'encadrement ! Vu les rĂ©sultats obtenus, nous es-pĂ©rons continuer la collaboration avec les 2A sur d'autressujets: Ă  discuter lors des rĂ©unions du groupe grenoblois !En tant que premiers utilisateurs, toutes vos remarquessur le nouveau site seront les bienvenues, n'hĂ©sitez pas Ă nous contacter (plus d'infos sur :

http://wiki.aae-ensimag.com/services).Laurent Testard (ENSIMAG 1993) & Fanny Strudel(ENSIMAG 1999)

XMP Business Angels : investisseur privé, fondd'investissement et formation XMP BUSINESS-ANGELS a pour vocation la mise en rela-tion entre des investisseurs privés personnes physiques(business angels) et des entrepreneurs à la recherche definancement. Les membres de cette association sont des ingénieurs di-plÎmés issus de l'Ecole Polytechnique, des Ecoles Natio-nales des Mines, de l'Ecole Nationale des Ponts et des

L’INRIA, partenaire de l’AAE EnsimagNous avons le plaisir et l’honneur de vous annoncer lepartenariat que nous venons de signer avec l’INRIA.

Les événements parisienspar Nadia Robinet, Ensimag 1990.

Cet automne Ă  Paris, l’AAE ENSIMAG est co-organisatricede deux Ă©vĂ©nements majeurs de l’institut G9+ dontnotre formation est membre actif :

La treiziĂšme rencontre annuelle de l’institut G9+abordera la pĂ©riode actuelle avec une doubleinterrogation :‱ Quel impact d'une pĂ©riode difficile sur l'Ă©cosystĂšme

DSI / fournisseurs ?‱ Face aux nouveaux dĂ©fis, quelles sont les opportunitĂ©s

Ă  saisir ?Une matinĂ©e d’exception le 23 octobre oĂč nous compte-rons parmi les intervenants Ludovic Le Moan ENSIMAG88, serial entrepreneur et crĂ©ateur de Goojet (prix de lameilleure start-up lors du WEB3 2007).ClĂŽturĂ©e par Louis Schweitzer, prĂ©sident de la Halde etprĂ©sident du Conseil d’administration de Renault, la ma-nifestation va rĂ©unir Ă  nouveau des intervenants de hautniveau, dans l’ambiance « zĂ©ro langue de bois » qui ex-plique son succĂšs constant.Une confĂ©rence sur le thĂšme des nouvelles stratĂ©giesĂ©conomiques et commerciales Open Source des Ă©di-teurs de logiciel. D’ores et dĂ©jĂ , rĂ©servez la soirĂ©e du2 dĂ©cembre 2008 dans votre agenda.Nous sommes Ă  la recherche de nouveaux sujets et in-tervenants pour les dĂźners-dĂ©bats et nous cherchons tou-jours Ă  enrichir l’offre destinĂ©e aux anciens Ă©lĂšves alorsn’hĂ©sitez pas Ă  nous soumettre vos idĂ©es et pourquoi pas,vous impliquer dans l’association.Contact : [email protected] Groupe : [email protected]

llaa vviiee ddee ll’’aassssoocciiaattiioonn

Page 34: Novembre 2008 i-mag

llaa vviiee ddee ll’’aassssoocciiaattiioonn

autres Ecoles d’Application traditionnellement associĂ©es.A ce titre les ingĂ©nieurs ENSIMAG peuvent adhĂ©rer Ă cette association. Chaque adhĂ©rent moyennant une cotisation annuelle sevoit proposer au cours de l'annĂ©e des opportunitĂ©s d'in-vestissement dans de jeunes entreprises lancĂ©es et dĂ©ve-loppĂ©es par des ingĂ©nieurs en majoritĂ© issus des Ă©colescitĂ©s ci dessus mais sans exclusive. L'investissement sefait Ă  titre personnel ou par un groupe d'investisseurs viaun pacte d'actionnaires. Le processus de sĂ©lection des en-treprises est dĂ©crit sur le site de XMP Business Angels.Dans le cadre de la loi TEPA, XMP Business Angels a ou-vert en Juin 2008 pour ses adhĂ©rents un fond d'inves-tissement Ă©ligible Ă  la dĂ©duction de l'ISF.Le fond investira dans les jeunes entreprises sĂ©lection-nĂ©es par les adhĂ©rents.Du fait de cette dĂ©ductibilitĂ© de nombreux fonds se dĂ©-veloppent rapidement et le nombre d'adhĂ©rents croit trĂšs

rapidement. Aujourd'hui les frais d'accĂšs sont rĂ©duits.Cependant la gestion des fonds levĂ©s va demander del'intelligence et du temps. Les gestionnaires de fond vontĂȘtre amenĂ©s prochainement Ă  monter les cotisations et-ou crĂ©er un droit d'entrĂ©e. XMP est probablement un ex-cellent observatoire des crĂ©ateurs d'entreprise et leurfond une opportunitĂ© plus un lieu d'Ă©changes. L'association organise Ă©galement en partenariat avecOSEO des journĂ©es de formation dont l'objectif est deprĂ©senter les modes opĂ©ratoires du Business Angel et decrĂ©er du lien entre les diffĂ©rents acteurs : investisseurs,rĂ©seaux, entrepreneurs.Pour mieux connaĂźtre XMP Business Angels, vous pouvezconsulter les informations sur leur site : http://xmp-ba.m4x.org/Etant adhĂ©rent de ce rĂ©seau vous pouvez aussi mecontacter : [email protected] Tariel (Ensimag 1974).

I-MAG - NOVEMBRE 200832

« Jean Pierre ANSART nous a quitté le 22 octobre 2008.

Ingénieur ENSIMAG 1972,

expert reconnu en télécommunications et intégration des

systÚmes hétérogÚnes, il demeure une référence cumulant

plus de 30 ans d'expérience dans le domaine des systÚmes

d'information ».

Jean Pierre Ansart démarre sa carriÚre en France au sein du

CNRS et d'IBM. En 1979, il rejoint MARBEN et créé la divi-

sion « Réseaux et Télécom ». En 1986, il crée MARBEN

PRODUCTS, société spécialisée dans les logiciels télécom

OSI et Ă©quipe la plupart des grands constructeurs mon-

diaux. Jean Pierre Ansart poursuit sa carriĂšre chez ATOS en

tant que directeur des divisions Télécom, Produit et Tech-

nologie. En 1996, il développe le premier prototype du lo-

giciel SCORT et fonde la société avec ses partenaires. Il

continue Ă  collaborer avec ATOS jusqu'en octobre 1999, en

qualité de Directeur Technique d'ATOS Intégration.

Depuis octobre 1999, Jean Pierre Ansart était président de

SCORT.

Nous nous associons Ă  la peine de son Ă©pouse Salwa et de

ses deux filles pour saluer la mémoire d'un homme hors du

commun.»

Jean-Pierre Ansart

Page 35: Novembre 2008 i-mag
Page 36: Novembre 2008 i-mag