Pip Installa BeautifulSoup: come installare BeautifulSoup

Vuoi installare BeautifulSoup di Python sul tuo computer? Entra ora e scopri come utilizzare il comando pip install BeautifulSoup per installare BeautifulSoup su Windows, macOS e Linux.

Pip Installa BeautifulSoup

BeautifulSoup è senza dubbio lo strumento di estrazione più popolare durante il web scraping in Python. Sebbene sia più comunemente usato insieme a Requests, una libreria HTTP, è stato utilizzato anche in Selenium e persino in Scrapy. Ciò è dovuto alla sua curva di apprendimento e alla facilità con cui semplifica l’analisi e l’estrazione dei dati da un documento di una pagina Web.

Potrebbe interessarti sapere che BeautifulSoup non fa parte della libreria standard Python. Ciò significa che dovrai installarlo come strumento di terze parti in altri per utilizzarlo. In questo articolo, ti mostrerò come installare Python usando il comando pip install.


Come installare BeautifulSoup sul tuo computer

Il primo passo per installare BeautifulSoup è installare Python sul tuo computer. Ti consiglio di scaricare l’ultima versione di Python 3 dal sito web ufficiale di Python. Ecco il collegamento alla pagina di download. Python è disponibile per Windows, macOS, Linux/UNIX e molti altri sistemi operativi.

Se lo hai scaricato e installato, o ne hai anche uno installato, puoi utilizzare il comando seguente nel prompt dei comandi o nel terminale per verificare la versione di Python installata.

python3 —version

>> Python 3.11.0

Puoi vedere l’output con (>>) all’inizio. Se non lo vedi, verrà sicuramente visualizzato un errore che suggerisce che l’installazione non è riuscita.

Con Python installato, puoi quindi passare al passaggio successivo, ovvero aggiornare la versione pip e quindi installare BeautifulSoup. Il modo in cui procedi è determinato dal sistema operativo del tuo computer.


  • Installazione di BeautifulSoup per Windows

Si consiglia di aggiornare la versione pip alla versione più recente prima dell’installazione. Utilizza il codice seguente per installare l’ultima versione di pip.

pip3 install —upgrade pip

Se il codice sopra è stato eseguito correttamente, è ora di installare BeautifulSoup sul tuo sistema. Puoi usare anche il comando pip seguente per farlo.

pip install beautifulsoup4

Come puoi vedere, non ho inserito beautifulsoup ma beautifulsoup4.


  • Installazione di BeautifulSoup per Linux e macOS

Come con Windows, ti consigliamo di aggiornare pip alla versione più recente per evitare eventuali problemi. Nella maggior parte dei casi, tuttavia, verrà installato senza problemi ma registrerà un avviso sullo schermo. Di seguito è riportato il comando pip per aggiornare la versione pip in macOS e Linux.

sudo pip3 install —upgrade pip

Il comando sopra aggiornerà pip alla versione più recente per te. Con pip aggiornato, puoi quindi utilizzare il comando pip seguente per installare BeautifulSoup.

sudo pip install beautifulsoup4

Come importare e utilizzare BeautifulSoup

Ora che hai importato BeautifulSoup, è ora di usarlo e lo usi allo stesso modo sia che utilizzi Windows, macOS o anche Linux. Se sei abituato a importare altri moduli, potresti volerlo importare con “import beautifulsoup4”. Ma questo genererà un’eccezione. Invece, puoi importarlo come vedi di seguito.

import requests

from bs4 import BeautifulSoup

page_content = requests.get(“YOUR_TARGET_URL”).content

soup = BeautifulSoup(page_content, “html.parser”)

a_elements = soup.find_all(“a”)

for a in a_elements:

            print(a)

Il codice riportato sopra visiterà qualsiasi URL fornito come sostituzione del TUO_TARGET_URL e scaricherà il contenuto della pagina. Lo inserirà quindi in BeaitufulSoup e troverà tutti gli elementi di ancoraggio (); quindi, utilizzando l’istruzione for-loop, stampa tutti gli elementi sulla console. Se controlli il codice sopra, vedrai che ho aggiunto “html.parser” come secondo argomento per BeautifulSoup.

Viene utilizzato per specificare il parser da utilizzare, nel mio caso, html.parser. Questo non è obbligatorio, poiché BeautifulSoup sceglierà per te se non lo specifichi. Tuttavia, stamperà un messaggio di avviso sullo schermo per te.


Conclusion

La libreria BeautifulSoup è incredibilmente utile per il web scraping poiché è possibile utilizzarla per estrarre facilmente i dati con API facili da apprendere. BeautifulSoup viene utilizzato principalmente insieme alle richieste di facile raschiamento dei dati dal web, ma un buon numero di sviluppatori lo utilizza insieme a Selenium e anche ad altri strumenti di web scraping.