diff --git a/web_moderno.md b/web_moderno.md index 7bc5331..05bcc7c 100644 --- a/web_moderno.md +++ b/web_moderno.md @@ -1,16 +1,34 @@ # La raccolta dati del Web 2.0 + +## Le origini dei siti web + Quando __Internet__ è stato creato, il protocollo __HTTP__ (utilizzato per visitare le pagine web) è stato pensato per trasferire dei semplici __ipertesti__ (da qui il nome _Hyper Text Transfer Protocol_) ma con l'enorme, rapida evoluzione del web il protocollo si è evoluto per supportare l'invio di qualsiasi tipo di file. + Contemporaneamente, i browser si solo evoluti per supportare l'esecuzione di __script__ inviati insieme agli ipertesti, __rendendo possibile trasformare una pagina web da un semplice ipertesto a un vero e proprio programma.__ -Anche se l'__accesso ai dati del dispositivo da parte degli script è molto limitato__, un sito web è in grado di __allegare uno o più script insieme all'ipertesto che causano l'invio di numerosi dati riguardo la visita al sito dal visitatore al server__. -Inoltre __gli script possono istruire i browser web a salvare delle informazioni o richiederle (cookie)__, __riconoscendo l'utente anche se si collega da una rete diversa__. + +Anche se l'accesso ai dati del dispositivo da parte degli script è molto limitato, __un sito web è in grado di allegare uno o più script insieme all'ipertesto, i quali vengono eseguiti immediatamente alla loro ricezione__. + +Questi script possono inviare numerosi dati riguardo la visita al sito, in particolare: + +- i click che sono stati fatti +- le sezioni che sono probabilmente state lette +- le pagine che sono state visitate e per quanto tempo +- le righe che sono state copiate + +## Persistenza + +Gli script possono istruire i browser web a salvare delle informazioni o, se presenti, spedirle al server (cookie) permettendogli di riconoscere l'utente anche durante le prossime visite. + +Grazie alla persistenza, i colossi dietro ai più visitati siti web possono profilare gli utenti, analizzando il loro comportamento. + La collaborazione tra i diversi colossi del web tra cui __Facebook, Google, Microsoft eccetera__ e la loro __integrazione con la maggior parte dei siti web__ consente a loro di __tracciare ogni attività online di ogni utente che utilizza questi servizi__. ## Perchè? Ci sono numerosi motivi per questa raccolta dati: -- __Pubblicità mirate:__ google piazza le pubblicità in base agli interessi dell'utente in modo da vendere di più -- __Vendita dei dati:__ i colossi possono vendere dati riguardo, ad esempio, l'interesse degli utenti verso un prodotto -- __Studio del mercato:__ analizzare i dati per comprendere l'andamento del mercato -- __Correlazioni tra soggetti apparentemente indipendenti__, ad esempio tramite questi dati si può scoprire che un utente di Facebook è interessato a prodotti Apple, piazzando ulteriori pubblicità mirate +- __Pubblicità mirate:__ Google piazza le pubblicità sulle pagine web in base agli interessi dell'utente che andrà a visualizzarle, in modo da ottenere più click e di conseguenza più guadagni +- __Vendita dei dati:__ i colossi possono vendere dati riguardo, ad esempio, l'interesse degli utenti verso un prodotto piuttosto che un altro +- __Studio del mercato:__ analizzando le mode e le discussioni sociali è possibile analizzare o addirittura prevedere svolte nel mercato di certe categorie o brand di prodotti +- __Correlazioni tra soggetti apparentemente indipendenti__, ad esempio si può scoprire che un utente di Facebook è interessato anche a prodotti Apple, piazzando ulteriori pubblicità mirate