Google presenta InkSight, l'AI che trasforma la scrittura a mano in testo digitale
La scrittura dell'intelligenza artificiale è ora migliore della mia
Google Research ha introdotto un nuovo sistema basato sull'intelligenza artificiale per leggere la scrittura a mano, che potrebbe rivoluzionare il modo in cui le macchine trasformano il testo scritto su carta in formato digitale. Il sistema InkSight converte le immagini di parole scritte a mano in testo digitale utilizzando l'intelligenza artificiale, senza la necessità di dispositivi intermediari.
L'obiettivo è sostituire il tradizionale riconoscimento ottico dei caratteri (OCR), che talvolta presenta errori, con un'intelligenza artificiale capace di emulare il modo in cui gli esseri umani apprendono a leggere, concentrandosi sull'intera parola piuttosto che sul singolo carattere. Per raggiungere questo risultato, i ricercatori hanno addestrato l'IA non solo a riconoscere, ma anche a imitare la scrittura manuale.
"La presa di appunti digitale sta guadagnando terreno, offrendo un metodo durevole, modificabile e facilmente indicizzabile per archiviare informazioni in forma vettoriale, noto come inchiostro digitale. Tuttavia, esiste ancora una notevole differenza rispetto al tradizionale scrivere su carta, un'abitudine che rimane preferita da molte persone", spiegano i ricercatori nel loro articolo. "Il nostro approccio integra i principi di lettura e scrittura, permettendo di addestrare un modello senza la necessità di grandi quantità di campioni accoppiati, che sono difficili da ottenere. A quanto ne sappiamo, questo è il primo lavoro che riesce a decodificare efficacemente il testo scritto a mano presente in fotografie con caratteristiche visive e sfondi diversi."
InkSight non è solo una tecnica alternativa, ma consente di ottenere risultati più accurati anche in situazioni sfavorevoli. Ad esempio, se la foto è scattata con scarsa illuminazione, se il testo è parzialmente oscurato o se è presente uno sfondo caotico, InkSight riesce comunque a produrre una lettura precisa, laddove l'OCR tradizionale potrebbe fallire. I ricercatori hanno scoperto che gli esseri umani erano in grado di leggere correttamente l'87% dei tracciati di testo prodotti da InkSight. In due terzi dei casi, i risultati erano così fedeli alla scrittura originale da non poter essere distinti da essa.
Scritto da AI
Se vi piace scrivere a mano, InkSight offre numerosi vantaggi potenziali. Immaginate di scrivere su un quaderno di carta e poi fotografare le vostre note, rendendole immediatamente ricercabili e facilmente organizzabili nel contesto di appunti precedenti presi su carta. Se, come me, avete una calligrafia disordinata, InkSight potrebbe trasformare i vostri scarabocchi in testo dattiloscritto accurato, che rispecchia ciò che avete effettivamente scritto.
A livello più ampio, questo sistema potrebbe diventare uno strumento fondamentale per decifrare e digitalizzare testi scritti a mano da secoli. Anche in caso di lingue poco rappresentate nel mondo digitale, InkSight potrebbe contribuire a preservare la scrittura a mano e a creare risorse per l'elaborazione linguistica di queste lingue.
Tuttavia, Google non è l'unica azienda a sviluppare strumenti di intelligenza artificiale per interpretare la scrittura a mano. Ad esempio, il nuovo Kindle Scribe di Amazon ha migliorato la capacità dell'e-reader di trasformare le note scritte a mano in testo digitale leggibile. Inoltre, esiste Goodnotes, un'app per prendere appunti che è in grado di riconoscere la scrittura a mano, e che recentemente ha introdotto funzionalità di modifica utilizzando la tecnologia Goodnotes Smart Ink. Questa tecnologia consente di trasformare la scrittura manuale in testo digitale, offrendo anche strumenti per modificare le note come se fossero state scritte a macchina, inclusi l'allineamento del testo, il copia e incolla, e il miglioramento della leggibilità del contenuto.
Get the best Black Friday deals direct to your inbox, plus news, reviews, and more.
Sign up to be the first to know about unmissable Black Friday deals on top tech, plus get all your favorite TechRadar content.
Nato nel 1995 e cresciuto da due genitori nerd, non poteva che essere orientato fin dalla tenera età verso un mondo fatto di videogiochi e nuove tecnologie. Fin da piccolo ha sempre esplorato computer e gadget di ogni tipo, facendo crescere insieme a lui le sue passioni. Dopo aver completato gli studi, ha lavorato con diverse realtà editoriali, cercando sempre di trasmettere qualcosa in più oltre alla semplice informazione. Amante del cioccolato fondente, continua a esplorare nuove frontiere digitali, mantenendo sempre viva la sua curiosità e la sua dedizione al settore.