Google laat AI-tool zien voor het lezen van handgeschreven tekst door deze digitaal te herschrijven
AI's handschrift is beter dan velen van ons
Google Research toont een nieuwe manier om AI te gebruiken voor het lezen van handgeschreven tekst. Dit zou de manier waarop machines op papier geschreven tekst omzetten naar digitale letters ingrijpend kunnen veranderen. Het InkSight-systeem zet foto’s van handgeschreven woorden om in digitale tekst door gebruik te maken van AI, zonder dat daar apparaten als tussenstap voor nodig zijn.
Het idee is om de soms gebrekkige optische tekenherkenning (OCR) te vervangen door AI die emuleert hoe mensen leren lezen. Dit gebeurt door bestaande tekst te herschrijven om te begrijpen hoe hele woorden eruitzien en wat ze betekenen. Hiervoor moesten de onderzoekers de AI zowel trainen in het herkennen als het nabootsen van menselijke handschriften.
"Digitale notities worden steeds populairder omdat ze een duurzame, bewerkbare en eenvoudig doorzoekbare manier bieden om notities op te slaan in vectorvorm, ook wel digitale inkt genoemd. Desondanks blijft er een grote kloof bestaan tussen deze manier van noteren en traditioneel pen-en-papier noteren, een praktijk die nog steeds door een grote meerderheid wordt verkozen," leggen de onderzoekers uit in hun paper. "Onze aanpak combineert lees- en schrijfprincipes, waardoor een model getraind kan worden zonder grote hoeveelheden gekoppelde voorbeelden, die moeilijk te verkrijgen zijn. Voor zover wij weten, is dit het eerste werk dat effectief handgeschreven tekst uit willekeurige foto’s met diverse visuele kenmerken en achtergronden omzet."
InkSight is meer dan alleen een alternatieve techniek. Het levert nauwkeurigere resultaten in minder ideale omstandigheden, bijvoorbeeld als de foto is genomen bij weinig licht, als de tekst deels verborgen is, of als de achtergrond verwarrend is voor OCR. De onderzoekers ontdekten dat mensen 87% van de door InkSight gemaakte teksttraceringen konden lezen. Tweederde daarvan was zo goed dat men het niet kon onderscheiden van echte handgeschreven tekst.
Geschreven door AI
Als je graag met de hand schrijft, biedt InkSight enkele mogelijke voordelen. Stel je voor dat je met de hand schrijft in een papieren notitieboek en vervolgens je aantekeningen aan je camera toont om ze direct te organiseren en te ordenen. Als je een rommelig handschrift hebt, kan InkSight helpen om je gekrabbel om te zetten in getypte tekst die nog steeds nauwkeurig is aan wat je hebt geschreven.
Op grotere schaal zou dit een cruciaal hulpmiddel kunnen zijn om handgeschreven tekst uit eeuwenoude documenten om te zetten in digitale vorm. Zelfs wanneer de tekst in een taal is met weinig digitale aanwezigheid, kan InkSight helpen om handschrift te behouden en zo een basis te leggen voor trainingsbronnen voor die talen.
Google is niet de enige die werkt aan AI-tools voor het ontcijferen van handschrift. Zo heeft Amazon bijvoorbeeld de nieuwe Kindle Scribe, die de e-reader verbetert met mogelijkheden om handgeschreven notities om te zetten in leesbare tekst. Er is ook Goodnotes, een digitale notitie-app die handschrift kan lezen en onlangs bewerkingstools voor handschrift heeft geïntroduceerd met de Goodnotes Smart Ink-technologie, waarmee handschrift kan worden omgezet in getypte tekst. Deze extra tools maken het mogelijk om handgeschreven notities te bewerken alsof ze getypt zijn, inclusief het uitlijnen, kopiëren en plakken, en het herschikken van tekst om deze logischer te maken.
Krijg dagelijks inzicht, inspiratie en aanbiedingen in je inbox
Meld u aan voor het laatste nieuws, recensies, meningen, toptechnologiedeals en meer.
Jouri heeft een passie voor esports en de laatste technische snufjes. Hij is ook de trotse eigenaar van een Garmin Instinct Crossover, die hij gebruikt om zijn workouts in de sportschool, bergwandelingen en avonturen in moshpits te tracken.
- Eric Hal SchwartzContributor