lunedì 4 luglio 2011

Web Invisibile e Deep Web.

Esplorare il profondo Web. ricerche non convenzionali

clip_image001Internet è composta di due parti distinte: una parte facilmente raggiungibile, nota come surface (o shallow) web e una il cui accesso a difficile, denominata deep web, il Profondo Web. Il surface web comprende semplici documenti di testo, normali pagine web e altre risorse disponibili gratuitamente su Internet. Il deep web comprende pagine web dinamiche, multimedia, servizi in abbonamento, articoli di giornali, database, gruppi di discussione, formati di documenti ad alto contenuto (quali pdf e doc) e risorse di intranet private. Il deep web è di gran lunga più grande (forse anche di ben 500 volte) del surface web.

Tantissime risorse, su Internet, non sono accessibili né visualizzabili con i motori di ricerca. Ecco alcuni esempi di risorse di questo tipo:

· Il contenuto di siti web che richiedono registrazione e collegamento con nome utente e password.

· Reti interne o private, note come intranet.

· Pagine che non hanno un collegamento diretto con Internet, né verso o da altre pagine.

· Risorse commerciali con limitazioni di dominio.

· Programmi dinamici quali dati richiesti da un modulo on-line.

· Siti web che utilizzano un file 'robots.txt' per chiedere ai motori di ricerca di non inserirli negli indici.

Molti strumenti consentono di cercare risorse nel surface web, ma ve ne sono pochi che consentono l’accesso al deep web. Per cercare qualcosa nel deep web occorre molta più esperienza, ma i risultati possono essere veramente gratificanti.

 

Motori di ricerca per deep web.

1. ClustyClusty 
Clusty è un motore di ricerca meta, nel senso che combina i risultati di una varietà di fonti diverse, filtrando i duplicati per vagliare i migliori contenuti che si potrebbe non aver visto altrimenti alla parte superiore dei risultati della ricerca con i tradizionali motori di ricerca.
2. SurfWax

surfwax

SurfWax ti dà la possibilità di trovare i risultati dai motori di ricerca multipli. È inoltre possibile creare SearchSets, i propri set personalizzato (liste) di fonti di salvare e utilizzare più e più volte. SurfWax è un buon strumento per approfondire il Web profondo, poiché recupera le informazioni che non sarai mai in grado di trovare con altri motori di ricerca.

3. Internet Archive

Internet Archive

L'Internet Archive è un incredibile  database di film, musica dal vivo, audio e materiali stampati, in più, si può guardare  le vecchie versioni salvate di quasi tutti i siti creati su Internet.

4. Scirus

Scirus è un motore di ricerca dedicato alla scienza solo ricerca scientifica contenuti specifici. Le ricerche Scirus sono effettuate su circa 370 milioni di pagine web specifiche di scienza, tra cui riviste scientifiche, homepages dedicate a scienziati', corsi, pre-print server di materiali, brevetti, e molto altro.

5. USA.gov

usa.gov

USA.gov è un portale di ricerca assolutamente gigantesco che dà l'accesso diretto al ricercatore ad una vasta gamma di informazioni e banche dati da parte del governo degli Stati Uniti, i governi statali e locali. Questo include l'accesso alla Biblioteca del Congresso, un indice A-Z, lo Smithsonian, e molto, molto di più.

Vedrete quanto saranno sorprendenti e più pescose le ricerche fatte in questo mare invisibile del Deep Web o Web invisibile.

Buona Navigazione.

Arrivederci al prossimo articolo.

Michele Balzano

Post più popolari