Dite ciao a BERT, il nuovo sistema che capirà meglio le frasi che scriviamo per cercare le cose online
Google ha annunciato l’introduzione di BERT, un’importante modifica agli algoritmi del suo motore di ricerca, per comprendere meglio il significato delle richieste che scriviamo quando cerchiamo qualcosa online. Il cambiamento potrà influire su circa il 10 per cento delle pagine dei risultati, con modifiche significative all’ordine dei link mostrati. Google dice che con il nuovo sistema potrà offrire un servizio migliore, soprattutto quando vengono utilizzate intere frasi come chiavi di ricerca, rendendo più naturale la formulazione delle richieste sul suo motore di ricerca.
BERT è l’abbreviazione di Bidirectional Encoder Representations from Transformers, un sistema per l’elaborazione del linguaggio naturale (NLP) per trattare automaticamente le informazioni scritte (e parlate) in una lingua naturale, cioè nel modo in cui parliamo comunemente tra di noi. Il sistema funziona tramite una rete neurale artificiale, un modello al computer che imita il più possibile il funzionamento dei neuroni – le cellule del cervello – e il modo in cui comunicano e collaborano tra loro.
a nuova soluzione è basata sui numerosi progressi raggiunti negli ultimi anni da Google nel campo delle intelligenze artificiali. I suoi ricercatori hanno sviluppato alcuni processi informatici che gestiscono le parole in una frase mettendole in relazione tra loro, invece di gestirle singolarmente come avveniva finora. I modelli basati su BERT hanno la capacità di prendere in considerazione l’intero contesto in cui è stata utilizzata una parola, ricostruendolo e analizzando le altre parole presenti nella frase. Questo meccanismo porta a un’interpretazione più accurata del senso della frase e di conseguenza migliora la qualità della risposta, data dai link nella pagina dei risultati del motore di ricerca.
Addestrare l’intelligenza artificiale dietro BERT ha richiesto tempo e numerose sessioni. Semplificando, i ricercatori hanno selezionato migliaia di frasi di senso compiuto scritte in inglese, e da ciascuna hanno eliminato a caso il 15 per cento delle parole. Poi hanno chiesto a BERT di intervenire e di provare a ricostruire le frasi, ritrovando i pezzi mancanti. Attraverso milioni di simulazioni, il sistema “ha imparato” a comprendere come funziona il contesto nelle frasi, e ad applicare le giuste soluzioni per dare nuovamente senso compiuto alle frasi mutilate dai ricercatori.
Google dice che la novità rende più pratica e semplice la ricerca delle cose online, perché BERT è più accurato nel mettere in relazione tra loro le parole. Col sistema precedente, una richiesta come “2019 viaggiatore brasiliano verso gli Stati Uniti ha bisogno del visto” sarebbe stata interpretata in modo piuttosto grezzo: l’algoritmo avrebbe analizzato le singole parole, deciso quali fossero più rilevanti e sulla base di queste avrebbe fornito i risultati. Nel farlo, il termine “verso” sarebbe stato sottovalutato, portando a risposte diverse dalla richiesta e che avrebbero compreso i siti che spiegano ai cittadini statunitensi se sia o meno necessario un visto per il Brasile.
BERT non tratta le parole indistintamente, ma le mette in relazione, ed è quindi in grado di comprendere che “verso” è importante e indica una specifica richiesta da un posto a un altro e non viceversa. Quella che per un algoritmo è solitamente una sfumatura trascurabile assume un significato molto più importante, paragonabile a ciò che facciamo noi stessi quando leggiamo o sentiamo in una frase quel termine.
Un altro esempio proposto da Google riguarda la richiesta: “Puoi ritirare un medicinale per qualcun altro in farmacia”. Il vecchio sistema avrebbe fornito risultati generici su come si ritirano i farmaci con prescrizione, mentre quello nuovo basato su BERT riesce a comprendere l’importanza di “qualcun altro” nella frase, e di conseguenza fornisce i risultati su come si debba fare per ritirare il medicinale vendibile solo con ricetta per conto di un’altra persona.
Google stima che la nuova modifica avrà un impatto sul 10 per cento circa delle risposte fornite dal suo motore di ricerca, un cambiamento enorme e tra i più rilevanti nella sua storia, che influirà sul nostro modo di trovare le risposte. Il sistema potrà inoltre rilevarsi utile per Assistente Google, l’assistente vocale che fornisce direttamente informazioni tramite Android o i dispositivi “intelligenti” per la casa.
BERT per ora funziona in inglese ed è entrato in servizio solamente negli Stati Uniti, ma Google confida di estenderlo in molti altri paesi nel corso dei prossimi mesi. Uno dei vantaggi del riconoscimento del linguaggio naturale tramite le reti neurali è che i sistemi si adattano facilmente ad altre lingue, senza richiedere cambiamenti significativi dei loro algoritmi.
Come avviene sempre in questi casi, Google non ha fornito molte altre informazioni sulle modifiche ai sistemi che fanno funzionare il suo motore di ricerca. La complessa serie di algoritmi che interpretano e gestiscono la gerarchia dei link nelle pagine dei risultati è segreta, un po’ come la ricetta completa della Coca-Cola. In questo modo Google ritiene che sia più difficile che alcuni gestori di siti si avvantaggino sui concorrenti, cercando di prevalere senza offrire contenuti di qualità (chi arriva più in alto nella pagina dei risultati ha maggiore visibilità e più possibilità di generare traffico).
Google modifica periodicamente i propri algoritmi, inserendo correzioni e aggiustamenti che non sempre vengono annunciati e talvolta passano inosservati. La società ha però spiegato che in questo caso la novità è più significativa di altre e che può essere considerata una delle più grandi da quando esiste. Google è il motore di ricerca più usato al mondo, con una quota di mercato intorno al 92,6 per cento: ogni giorno gestisce 5,4 miliardi di ricerche sul Web.