World Wide Web:in peruskäsitteet


[Johdanto] [Hakemisto] [HTML]

WWW-selausohjelma

Jotta pääsisit selaamaan WWW:tä tarvitset selausohjelman. Selausohjelmia on kaikille suosituille käyttöjärjestelmille, ja niitä on sekä tekstipohjaisina että graafisille käyttöliittymille tehtyinä versioina. Selausohjelma käyttää HTTP:tä siirtääkseen WWW-palvelimelta sivuja jotka on kirjoitettu HTML:llä. Usein ohjelma pitää muutaman viimeisen sivun muistissa, koska käyttäjä palaa usein taaksepäin hakiessaan tietoa.

Lynx

Suosituin tekstipohjainen WWW-selausohjelma lienee lynx. Vaikka yhä useammat WWW-sivut sisältävät kuvia ja siten eivät ole lynxin näytettävissä, lynxillä on myös hyvät puolensa. Sitä voi käyttää suoraan tekstipäätteellä, ja se ei vietä aikaa kuvien lataamiseen. TKK:n ATK-keskuksen koneissa lynx käynnistyy käskyllä lynx.

Netscape Navigator

Netscape Navigator on tätänykyä ehdottomasti suosituin WWW-selausohjelma. Akateemiset laitokset, kuten TKK ja TKY, saavat käyttää sitä täysin maksutta, ja myös tavallisille kotikäyttäjille se on edullinen. Netscape on aktiivisesti vaikuttanut uuden HTML 3.0-standardin kehittykseen.

NCSA Mosaic

Ennen Navigatorin julkaisemista Mosaic oli ainoa kunnollinen WWW-selailija. NCSA ei kuitenkaan ole satsannut yhtä paljon resursseja vapaan Mosaic-ohjelman kehittämiseen kuin Netscape osittain maksulliseen Navigator-ohjelmaansa.

WWW-palvelin

WWW-palvelin on tietokone joka sijaitsee jossain Internetissä. Selausohjelma hakee WWW-sivut suoraan palvelimelta ellei käytössä ole WWW-proxy. Palvelimessa pyörii erillinen ohjelma, joka ottaa vastaan HTTP-pyynnöt ja käsittelee ne. Useimmiten palautetaan palvelimen levyltä löytyvä sivu, mutta joskus sivu myös tuotetaan ajamalla erillinen ohjelma.

Palvelimen Internet-osoite ilmenee URLista, ja selatessaan WWW:tä kannattaa aina muistaa että haut kaukaisista paikoista voivat kestävät pitkään ja kuormittavat verkkoa paljon.

WWW-palvelimia syntyy ja kuolee joka päivä, joten missään Internetistä ei löydy täydellistä luetteloa kaikista palvelimista. Tämä on tyypillistä WWW:lle - tieto ei löydy valmiina, vaan joudut itse "metsästämään" sitä.

URL - Uniform Resource Locator

Vaikka URL ehkä kuullostaa eksoottiselta, se ei ole kovin hankala käsite. Se on oikeastaan osoite, joka kertoo mistä palvelimesta WWW-sivu on haettavissa. URL näyttää esimerkiksi seuraavalta:

http://www.niksula.cs.hut.fi/~ged/WWW-opas/Perusteet.html

URLi koostuu kahdesta osasta, protokollatietueesta ja protokollan vaatimasta parametritiedoista, joita erottaa kaksoispiste. Yllä olevassa esimerkissä protokolla on http ja parametritiedot ovat //www.niksula.cs.hut.fi/~ged/WWW-opas/Perusteet.html.

Yleisimmät protokollat HTTP ja FTP käyttävät samoja parametritietoja. Ensin tulee palvelimen Internet-osoite (esimerkissä www.niksula.cs.hut.fi) ja sitten WWW-sivun sijainti palvelimessa (~ged/WWW-opas/Perusteet.html). Ennen osoitetta kirjoitetaan kaksi kauttaviivaa '//' ja osoitetta erottaa sivun sijainnista yksi kauttaviiva '/'.

Yleisen käytännön mukaan koneen käyttäjien kotisivut löytyvät käyttäjätunnuksen avulla, siten että tunnuksen eteen liitetään tilde '~' (esimerkissä ~ged, eli käyttäjätunnus on ged). Samoin käytäntö, ja monet WWW-palvelimet, vaatii että hakemistoon viittaava URL loppuu kauttaviivaan '/'. Täten http://www.niksula.cs.hut.fi/~ged on oikeastaan väärin, ja http://www.niksula.cs.hut.fi/~ged/ on oikein. Mm. Netscape Navigator osaa itse lisätä kauttaviivan tarvittaessa.

HTTP - Hypertext Transfer Protocol

En rupea tarkemmin selittämään HTTP:n syntaksia, koska WWW:n peruskäyttäjä ei ikinä joudu suoraan sen kanssa tekemisiin. HTTP on kieli jolla WWW-selausohjelma keskustelee WWW-palvelimien kanssa. Yksi tärkeä piirre tässä kielessä on tiedoston tyypin välittyminen. Täten WWW-selausohjelma pystyy tietämään miten saapuva tiedosto pitää käsitellä, eli HTML-sivu pitää näyttää käyttäjälle, äänitiedosto pitää soittaa ja pakattu ohjelmapaketti pitää tallettaa levylle. Jos tyyppi on tuntematon, WWW-selausohjelma voi kysyä käyttäjältä neuvoa.

FTP - File Transfer Protocol

FTP on vanha Internet-protokolla. Sen avulla on pitkään siirretty tiedostoja eri koneiden välillä, mutta WWW tuo tähänkin uuden piirteen. WWW-selausohjelmat osaavat myös FTP-protokollan ja pystyvät siis näyttämään hakemistopuita ja siirtämään tiedostoja aivan kuten FTP-ohjelmat. Tämä tarkoittaa että WWW-sivulta voi olla linkki suoraan FTP-palvelimeen, eikä käyttäjä joudu vaihtamaan ohjelmaa siirtääksen tiedostoa kotiin. FTP-linkin tunnistaa siitä että sen URL alkaa ftp:llä http:n sijasta.

WWW-proxy

Jotkut yritykset ovat suojanneet sisäistä verkkoaan siten, ettei verkosta pääse suoraan WWW:hen. Koska käyttäjät kuitenkin haluavat WWW-yhteyden, HTTP tarjoaa mahdollisuuden pystyttää WWW-proxy-palvelimen. Tällainen palvelin eristää kaksi verkkoa toisistaan, siten että sisäisestä verkosta menevä HTTP-kysely ohjataan WWW-proxyyn. Proxy ottaa yhteyttä URLin osoittamaan paikkaan, hakee siitä sivun ja palauttaa sen sisäisessä verkossa olevalle koneelle.

WWW-proxyn merkitys olisi pieni jos se vain tarjoaisi verkon eristämismahdollisuutta. Näin ei kuitenkaan ole, sillä useimmat proxyt sisältävät myös levymuistin (engl. cache), jossa suosituimmat sivut pidetään tallessa. Tällöin WWW-proxy voi vastata HTTP-kyselyyn nopeasti ja palauttaa levymuistissa olevan kopion sivusta. Joidenkin sivujen sisältö vaihtelee, joten niitä voi säilyttää levymuistissa. HTTP on suunniteltu tällaisia sivuja silmällä pitäen, joten proxy tietää milloin sivua ei kannata tallettaa.

TKK:lla on erittäin suositty WWW-proxy joka toimii osoitteessa wwwproxy.hut.fi, sen porttinumero on 80. Jos käytät WWW-selausohjelmaa TKK:lla, tarkista että sinulla on proxy-asetus kunnossa.


[Johdanto] [Hakemisto] [HTML]
Camillo Särs <Camillo.Sars-at-iki.fi>