Appunti Internet - © 1997-2003 Loris Tissino
Il browser web è il programma che l'utente usa per accedere a documenti presenti nel world wide web. Il termine browser letteralmente significa "sfogliatore" (visto che si usa per sfogliare le pagine web). In italiano a volte si usa il termine "navigatore" e si dice "navigare nel web".
Un browser deve essere in grado di:
Altre funzioni che normalmente vengono messe a disposizione da un browser sono le seguenti:
Inoltre, i browser devono essere in grado di gestire un certo livello di configurazione da parte dell'utente (indicazione della lingua preferita, della dimensione dei caratteri, ecc.), alcuni aspetti relativi alla sicurezza (gestione dei contenuti "attivi", cioè di programmi di cui viene richiesta l'esecuzione al calcolatore che li riceve), alla gestione delle sessioni di lavoro, ecc.
Esistono molti browser, che si differenziano sia dal punto di vista tecnico (cosa fanno, come lo fanno) sia dal punto di vista della distribuzione e della politica di licenze (come per tutti i tipi di programmi).
I browser si differenziano per l'interfaccia (grafica o testuale), la configurabilità (più o meno spinta), il supporto per gli standard, e così via. Come per tutte le categorie di applicazioni, è più importante capire le funzionalità generali che imparare scorciatoie e pulsanti. In questo documento faremo riferimento ad un browser libero, Mozilla, ma i concetti appresi potranno essere facilmente adattati ad altri programmi della categoria.
Le funzioni di base di un browser sono abbastanza standardizzate. Tramite una "barra degli strumenti", i menù, particolari "scorciatoie da tastiera", o interagendo con la pagina visualizzata, è normalmente possibile:
Essere in linea di per sè significa essere collegati ad Internet (ad esempio, con il modem acceso ed un collegamento al proprio Internet Service Provider, oppure con un'interfaccia di rete attivata). Mettere fuori linea il proprio browser non vuol dire però scollegarsi da Internet ("staccare" il modem), bensì indicargli di non rivolgersi a server web per richiedere documenti, e di utilizzare solo documenti presenti nel file system locale (normalmente, quelli ottenuti durante precedenti attività, o quelli di un cd-rom).
In pratica, sono possibili queste quattro combinazioni:
| browser in linea | browser non in linea | |
|---|---|---|
| connesso ad Internet | i link funzionano, si possono vedere tutte le pagine del WWW, ecc. | si possono vedere solo le pagine presenti nella cache, ma si continua a sostenere il costo della connessione (però forse abbiamo altri programmi in esecuzione che la richiedono, come ad esempio un client e-mail o FTP) |
| sconnesso da Internet | si possono seguire solo i collegamenti ipertestuali che portano a pagine presenti nel file system locale; alcuni browser segnalano l'impossibilità di seguire gli altri e propongono il passaggio alla modalità in linea se si tenta di seguire gli altri collegamenti ipertestuali | si possono vedere solo le pagine presenti nel file system locale o nella cache, ma senza sostenere il costo della connessione (ottima modalità di lavoro quando ad esempio si consultano pagine web presenti nel proprio hard disk o su di un cd-rom) |
Molto spesso si accede al WWW per cercare documenti su qualche argomento di interesse. Una volta trovato il documento, per poterlo utilizzare (leggere, stampare, importare, ecc.) sono possibili diverse strade:
Alcuni browser mettono a disposizione anche modalità diverse, come il salvataggio in formato posta elettronica e la possibilità di predisporre operazioni di sincronizzazione (a intervalli regolari o su richiesta il browser controlla che i file nella propria cache corrispondano agli originali).
A volte può tornare utile cercare di riprodurre siti web esterni sul proprio hard disk. L'operazione non sempre è fattibile per motivi tecnici, ma è bene sapere che esistono dei programmi che si possono tentare di sfruttare. Alcuni funzionano cercando di ricreare la struttura della directory esterna in locale "copiando" i file. Altri si appoggiano ad un browser "comandandogli" il recupero di pagine web collegate a quelle di partenza. Altri ancora funzionano in maniera analoga ad un proxy server.
Se si dispone di un elenco di URL di pagine web che si desiderano leggere, a volte potrebbe essere conveniente sfruttare programmi come wgetdalla riga di comando o tramite un front-end grafico.
Ad esempio, per fare una copia dell'intero contenuto di un sito web si può utilizzare il comando
wget --mirror --no-parent http://www.qualchesito.xy
[wget supporta molte opzioni per la personalizzazione, si consulti la guida in linea per i dettagli]
In alcune configurazioni di rete, viene suggerito di utilizzare una connessione tramite server proxy. Il termine inglese proxy significa "procuratore, intermediario". Sostanzialmente, un server proxy è un programma che lavora come intermediario tra il nostro browser e il server web remoto. Il browser non invia direttamente la richiesta al server web remoto, ma la invia al server proxy, il quale la inoltra a destinazione. Quando arriva la risposta, questa viene fornita al browser ha fatto la richiesta iniziale.
Un'inutile complicazione? No, perché i server proxy possono svolgere alcuni utili compiti: