Alibaba sfida Google: ZeroSearch riduce i costi dell’AI per le ricerche fino all’88%
Il nuovo sistema elimina la dipendenza dalle API esterne generando documenti simulati per addestrare i modelli.

Il laboratorio Tongyi Lab di Alibaba ha sviluppato un nuovo metodo per addestrare modelli IA per la ricerca senza utilizzare motori di ricerca reali. Secondo l’azienda, questa tecnica consente di ridurre i costi di addestramento fino all’88% rispetto all’utilizzo di API commerciali come quelle di Google.
Nel paper intitolato "Incentivize the Search Capability of LLMs without Searching", i ricercatori spiegano come vengano utilizzati documenti simulati generati dall’IA per imitare i risultati dei motori di ricerca reali. Questo approccio permette ai modelli di apprendere comportamenti di ricerca efficaci, senza dover effettuare richieste esterne o accedere a contenuti web.
Secondo gli autori, l’uso di documenti simulati non solo riduce i costi, ma migliora anche la qualità dell’addestramento, poiché “la qualità dei documenti restituiti dai motori di ricerca è spesso imprevedibile” e può introdurre rumore nei dati.
Questa innovazione potrebbe aprire nuove strade per lo sviluppo di modelli linguistici più efficienti, indipendenti dai principali provider di ricerca.
ZeroSearch di Alibaba sfida Google: costi minimi, ma servono GPU
Nel nuovo studio, i ricercatori di Alibaba sottolineano che “la differenza principale tra un motore di ricerca reale e un LLM simulato sta nello stile testuale dei contenuti restituiti”. Il sistema sviluppato, chiamato ZeroSearch, è anche in grado di degradare progressivamente la qualità dei documenti simulati, per creare scenari di ricerca sempre più complessi e realistici.
Il vantaggio principale resta comunque il risparmio economico. Addestrare un modello ZeroSearch da 14 miliardi di parametri costa circa 70,80 dollari ogni 64.000 query, contro 586,70 dollari utilizzando le API di Google. I costi scendono ulteriormente per i modelli da 7B e 3B, rispettivamente a 35,40 e 17,70 dollari per la stessa quantità di richieste. Il tempo necessario per l’addestramento rimane invariato rispetto al metodo con API commerciali.
Tuttavia, Alibaba ammette alcuni limiti. Il metodo ZeroSearch richiede uno, due o quattro GPU A100, mentre le API di Google non necessitano di GPU, rendendole più leggere in termini di consumo energetico e impatto ambientale. “Il nostro approccio comporta costi infrastrutturali aggiuntivi, anche se resta più economico rispetto alle API commerciali”, concludono gli autori.
Iscriviti alla newsletter di Techradar Pro per ricevere tutte le ultime notizie, opinioni, editoriali e guide per il successo della tua impresa!
Nonostante questi ostacoli, la tecnologia ha il potenziale per ridurre la dipendenza da piattaforme costose e chiuse come Google, contribuendo a democratizzare l’accesso allo sviluppo IA.
Nato nel 1995 e cresciuto da due genitori nerd, non poteva che essere orientato fin dalla tenera età verso un mondo fatto di videogiochi e nuove tecnologie. Fin da piccolo ha sempre esplorato computer e gadget di ogni tipo, facendo crescere insieme a lui le sue passioni. Dopo aver completato gli studi, ha lavorato con diverse realtà editoriali, cercando sempre di trasmettere qualcosa in più oltre alla semplice informazione. Amante del cioccolato fondente, continua a esplorare nuove frontiere digitali, mantenendo sempre viva la sua curiosità e la sua dedizione al settore.