World Wide Web

Un article de Wikipèdia, l'enciclopèdia liura.

Representacion grafica deu World Wide Web a l'entorn de Wikipèdia

Lo World Wide Web, literaument "la telaranha mondiau", o simplament Web, o tanben la Tela o lo WWW, qu'ei un sistèma ipertèxte public qui fonciona sus l'Internet e qui pemet de consultar, dab un navigator web, paginas hicadas en linha dens sites. L'imatge de la tela que vien deus iperligams qui ligan las paginas web enter eras.

Lo Web n'ei pas qu'ua de las aplicacions de l'Internet. D'autas aplicacions de l'Internet qu'existeishen, com lo corrièr electronic, la messatgeria instantanèa, Usenet, etc. Lo Web qu'estó inventat annadas arron de l'Internet, mes qu'ei eth qui aperè l'atencion deus mèdias e deu gran public sus l'Internet. Despuish ençà, lo Web e l'Internet que's sòlen con•hóner dens lo lengatge corrent.


Somari

[modificar] Istòria

Ordinator NeXTcube utilizat per Berners-Lee com prumèr servidor web.

En 1980, lo CERN qu'avè besonh d'un sistèma entà escambiar informacion enter cercaires peu mèdi d'ipertèxte. Tim Berners-Lee que hasó un prototipe mentavut ENQUIRE. Quan lo CERN e devienó lo màger nod de l'Internet de la tempsada (en aqueth moment sonque TCP, DNS...), Berners qu'ensagè de i connectar lo sistèmi qui avè creat. Lo 12 de noveme 1990 que publiquè l'invencion dab Robert Cailliau.

Lo prumèr servidor Web qu'estó un ordinator deu tipe NeXTcube. Per Nadau de 1990 que's creè las prumèras paginas Web, qui explicavan lo projècte en si, lo prumèr servidor d'HTTP (tanben creat entad eth) e lo prumèr navigator, mentavut WorldWideWeb (totun com lo protocòle, e mei tard arrenomiat Nexus entà evitar confusions).

[modificar] Foncionament

Normaument, la visualizacion d'ua pagina Web que comença quan l'utilizator introduseish ua URL dens la barra de navigacion deu navigador Web o quan segueish un iperligam, o ligam informatic, de cap tad aquera pagina o ressorça.

Alavetz, l'URL introdusida que's traduseish en ua adreça IP peu mèdi de DNS, ua basa de dadas distribuïda globaument qui contien las equivaléncias domeni-adreça ip. Aquera adreça IP qu'ei necessària entà saber a quin servidor e s'a a adreçar la consultacion. Puish lo navigator Web qu'envia la consultacion au servidor HTTP qui a hèit la demanda.

La pagina Web que restituëish en generau un archiu au format HTML. Aqueste archiu qu'ei immediatament interpretat peu navigator. Quan lo navigator e sap dejà de quinas ressorças aurà besonh entà amuishar la pagina, que torna har ua consultacion HTTP en demandant los imatges e las autas ressorças qui hèn partida de la pagian (archius css, javascript, applets java..).


[modificar] Arquitectura

[modificar] Modèl matematic

Lo Worl Wide Web, com ensemble de ressorças ipertèxte, que's pòt modelizar en est modélisable en grafe orientat dab las ressorças entà somius e los iperligams entà arcs. Com lo grafe ei orientat, dauvuas ressorças que pòden constituïr potz (o honsets, mensh formaument): n'existeish pas nat camin de cap tà la rèsta deu Web.

[modificar] Exploracion deu Web e Web pregon

L’exploracion recursiva deu Web a partir de ressorças plan causidas qu'ei lo metòde de basa programat dens los robòts d’indexacion deus motors de recèrca. En 2004, los motors de recèrca qu'indexavan uns 4 miliards de ressorças. Lo Web pregon, o Web invisible, qu'ei la partida deu Web qui n’ei pas indexada e ei donc impossibla a trobar dab los motors de recèrca generalistas. Estudis que i a qu'indican que la partida invisibla deu Web e representa mei deu 99 % deu Web[1]. Lo Web pregon que compren las ressorças seguentas:

  • las ressorças inaccessiblas au public, donc aus robòts, entermiei las quaus e son las paginas administrativas o pagantas, protegidas per un mot de passa;
  • las ressorças qui ne son pas communicadas per protocòles de communicacion pres en carga peus robòts (sovent ne prenen pas en carga que HTTP e HTTPS) ;
  • las ressorças dont lo format de dadas n'ei pas pres en carga peu robòt;
  • las ressorças listadas dens un fichèr d’exclusion deus robòts;
  • las ressorças excludidass peu robot per'mor d'estar concebudas entà abusar deu referenciament (spamdexing);
  • las ressorças excludidas peu robòt per'mor de non pas estar consideradas pro pertinentas (per exemple s'un site e contien milions de ressorças qui ne son pas ligadas per nat aute site);
  • les ressorças de cap tà las quaus los iperligams e son creats dinamicament en responsa a las interrogacions deus visitaires. Las ressorças aquestas que sòlen proviéner de basas de dadas e que constituëishen la partida mei importanta deu Web pregon.

[modificar] Servidors publics

L’exploracion recursiva n'ei pas lo sol mejan utilizat entà indexar lo Web e pagerar la soa talha. Que i a ua auta solucion, qui consisteish a pagerar l'infraestructura informatica connectada a l'Internet entà aubergar sites Web. Au lòc de seguir iperligams, aqueth metòde que consisteish a utilizar los noms de domeni enregistrats dens lo Domain Name System e ensajar de's connectar a tots los servidors Web potenciaus. Aqueth metòde que l'utiliza la societat Netcraft, qui publica regularament los resultats de las soas exploracions, dont las pagèras de popularitat deus servidors HTTP. D'aquera faiçon, totun, que s'i pagèra mei l'utilizacion de las tecnologias deu Web que lo Web medish, mes que's pòden trobar atau sites Web publics qui ne son pas ligats au World Wide Web.

[modificar] Intranets e Webs privats

Un Web disponible sus un intranet qu'ei privat. Que pòt estar completament separat deu Web, o estar ua hont deu Web. Qu'ei ua hont quan l'intranet ei religat a l'Internet e qui un iperligam deu Web e punta sus ua ressorça deu Web. Los ligams deu Web enlà que son per venciva impossibles puishque per definicion un intranet n'auhereish pas nat accès public.

Ua hont que's pòt trobar sus l'Internet. En aqueth cas, que constitueish un Web virtuaument privat, per'mor que lo public ne'u pòt pas descobrir en seguint iperligams.

[modificar] Nòtas

  1. (en)The Deep Web: Surfacing Hidden Value, Michael K. Bergman, The Journal of Electronic Publishing, August, 2001, Volume 7, Issue 1