Che cosa è BLOOM, il large language models (LLM) open source

boom - bigScience Iniciative

A luglio 2022 è stato rilasciato BLOOM, un nuovo LLM (large language models) in grado di competere con LaMDA e con GPT-3, ma completamente open source.

I Large language models (LLMs) hanno aperto una porta su un mondo nuovo, dove le intelligenze artificiali (AI) sono in grado di generare testi e di programmare quasi come essere umani.

In realtà, il quasi è relativo. In alcuni casi, infatti, se programmati adeguatamente, la produzione del testo è equiparabile al lavoro di un autore umano.

Leggi anche “Che cos’è un AI content generator“.

BLOOM in breve:

  • 46 linguaggi naturali
  • 3 linguaggi di programmazione
  • 176 miliardi di parametri
  • 100 miliardi di parametri per spagnolo, arabo e francese (nessuno ne ha di più per queste lingue)
  • Open Source (utilizzabile gratuitamente)

In merito ai parametri, ricordo che OPT, il modello linguistico di META (Facebook), prevede 175 miliardi di parametri.

La creazione di BLOOM è stata resa possibile sotto la guida di Hugging Face, che ha guidato il progetto BigScience collaborando con GENCI, il team IDRIS del CNRS, il team Megatron di NVIDIA e il team Deepspeed di Microsoft, nonché le oltre 250 entità (università, startup e imprese) supportando i vari partecipanti al progetto tra cui EleutherAI e l’Allen Institute for AI.

Il nome BLOOM è acronimo di BigScience Large Open-science Open-access Multilingual Language Model).

Un LLM open source accessibile a tutti gratuitamente

Oggi sono in molti a investire nei large language models, META e Google sono solo un esempio, ma ricercatori e aziende che non hanno fondi rischiano di restare indietro sull’argomento.

Questo però non è il caso di BLOOM.

BLOOM è stato realizzato grazie a 3 un finanziamento di 3 milioni da parte delle Agenzie Francesi di Ricerca CNRS e GENCI.

I ricercatori potranno avere un pieno accesso al codice, come non è stato permesso da Open AI, creatori del GPT-3 e da Google.

Le premesse di BLOOM, invece, sono di permettere un’accesso più democratico alle tecnologie legate all’intelligenza artificiale.

Oggi sono in molti a investire nei large language models, META e Google sono solo un esempio, ma ricercatori e aziende che non hanno fondi rischiano di restare indietro sull’argomento.

Questo però non è il caso di BLOOM.

BLOOM è stato realizzato grazie a 3 un finanziamento di 3 milioni da parte delle Agenzie Francesi di Ricerca CNRS e GENCI.

I ricercatori potranno avere un pieno accesso al codice, come non è stato permesso da Open AI, creatori del GPT-3 e da Google.

Le premesse di BLOOM, invece, sono di permettere un’accesso più democratico alle tecnologie legate all’intelligenza artificiale.

Dove scaricare BLOOM

BLOOM è open source e chiunque può, scaricarlo, basta andare nella sezione download del sito della Hugging Face.

Cosa può fare BLOOM

BLOOM è stato realizzato grazie al lavoro di oltre 1000 ricercatori provenienti da oltre 70 stati e 250 istituzioni. Il lavoro è durato un’anno e ha permesso di creare un LLM in grado di simulare, sempre con dei limiti, il linguaggio umano.

Con BLOOM, per esempio, è possibile:

  • Creare chatbot
  • Realizzare articoli per blog
  • Moderare conversazioni online

Non so se è chiaro, ma tutto questo potrebbe cambiare completamente non solo la SEO copywriting, ma tutto il marketing digitale.

Per non parlare poi delle infinite applicazioni dell’AI.

Gli aspetti negativi di un AI content writer

Non bisogna però mai dimenticare gli aspetti negativi di tutto questo.

Per esempio, se creare testi diventerà estremamente semplice, potremmo assistere alla diffusione senza controllo di Fake News.

Per esempio, un governo autoritario potrebbe inondare il web di notizie false,  rendendo molto difficile ai motori di ricerca distinguere le notizie vere dal mare di fake news.

Oggi, nell’era della digitalizzazione e della libera circolazione delle informazioni, è facile pensare che sia più semplice trovare la verità e smascherare le “Notizie di regime”.

Purtroppo è esattamente l’opposto.

Esponenti politici disonesti, e governi autoritari, sfruttano la libera circolazione delle informazioni per diffondere fake news sempre più difficili da distinguere dalla verità.

Al momento poi, nonostante il loro dichiarato impegno, grandi aziende come Google, META e Twitter sono riuscite a fare ben poco per tutelare la verità.

Difendere il web e la verità è un dovere di tutti.