Web Scraping e tecniche SEO

web-scraping-seo

Cos’è il web scraping

Sai cos’è il web scraping? E’ una tecnica Seo. Fanno parte dello web scraping tutte quelle tecniche che si prefiggono lo scopo di estrarre dati da un sito web.

Qualche approfondimento lo possiamo trovare su Wikipedia https://it.m.wikipedia.org/wiki/Web_scraping

Perchè si usano le tecniche scraping?

Lo scraping ha diversi diversi ambiti di utilizzo in chiave Seo e l’immaginazione è l’unico limite. Molte delle funzioni utilizzate in software tipo Semrush sono basati su tecniche molto simili allo scraping.

Diciamo che i principali utilizzi di queste tecniche sono:

  • analisi concorrenti;
  • analisi backlink;
  • statistiche personalizzate;
  • analisi Seo personalizzate;
  • analisi della serp;

Come funziona lo scraping?

I programmi o gli algoritmi che gestiscono queste tecniche simulano in maniera automatica la navigazione umana sul web ed estraggono, attraverso particolare tecniche di programmazione, i dati desiderati.

Va da se che quando i dati vengono estratti e salvati offline, è possibile elaborarli nei modi più diversi.

Esiste una stretta correlazione tra seo e il web scraping.

Ad esempio, lo scarping offre un grosso aiuto nell’analisi della Serp. Per una buona indicizzazione, sopratutto in una prima fase di programmazione editoriale, lo scraping può permetterci di capire quello che gli utenti cercando e si muovono. In questo modo non solo possiamo adattare la nostra programmazione editoriale ma possiamo anche comprendere i contenuti che Google premia e quelli che non ama.

Sarebbe possibile fare scraping anche manualmente ma l’utilizzo programmi o script permette di velocizzare l’estrazione e l’analisi dei dati.

Personalmente uso php per fare un pò tutto. Penso che l’accoppiata php+mysql sia ottima.

Web Scraping e php

web-scraping

Per comprendere meglio di cosa parliamo entriamo nello specifico.

Un piccolo esempio di scraping in php

 

  1. <?php
  2. $url_sito = ‘http://www.pippo.com';
  3. $output = file_get_contents($url_sito);
  4. echo $output;
  5. 5. ?>

In questo caso il nostro programmino non fa altro che leggere il contenuto di una pagina e stamparlo a video. Molto semplice direi. Ma se salvassimo i dati in un database? O in un file? Bè avremmo la possibilità di maneggiare i dati e tramite dei pattern anche di estrapolarli a nostro piacimento.

Se ad esempio nel nostro script inserissimo l’istruzione preg_match (completandola con una pattern a noi congeniale) potremmo estrapolare i contenuti che ci interessano e manipolarli.

Geniale no?

La tecnica dello scraping è molto potente permette di estrarre e manipolare per capire quello che alla superficie non si vede.

Lo scraping è una tecnica molto potente, va usata con raziocinio. La legge regolamenta questo tipo di algoritmi. La tecnica dello scraping web, usata in modo negativo, può essere fruttata per “rubare” indirizzi email o profilare utenti, violando quindi la privacy, gli utenti web.

Il lato oscuro della forza

Questo articolo è stato scritto a scolo puramente didattico e sconsiglio vivamente di utilizzare questo tipo di tecniche. L’informatica, come tante altre discipline scientifiche, può essere utilizzata per scopi positivi e negativi. Sta a noi decidere qual’è il modo eticamente corretto.