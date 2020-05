Websites op het internet beginnen met de dag er meer hetzelfde uit te zien. Vandaar dat The Conversation gestart is met een onderzoek om de volgende vraag te beantwoorden: Waarom beginnen websites op elkaar te lijken?

Onderzoekers Sam Goree, Bardia Doosti, David Crandall en Norman Su hebben een serie van dataminingstudies doorgelopen om 200.000 afbeeldingen over 10.000 websites geanalyseerd om antwoord te vinden op bovenstaande vraag.

Voor hun onderzoek maakten zij gebruik van de Russell 1000, wat bestaat uit websites van de top VS zakenmarkt, gebaseerd op marktkapitalisatie. Dit hebben ze samen met Alexa's 500 meest bezochte websites en websites genomineerd voor Weebly Awards geanalyseerd. Ter aanvulling heeft het team afbeeldingen van webpagina's van Internet Archive gebruikt om gelijkenissen in visuele elementen van sites beter te leren begrijpen.

The Conversation onderzocht specifieke attributen, waaronder kleur en lay-out, samen met attributen die automatisch worden aangeleerd uit gegevens met behulp van kunstmatige intelligentie. Voor de kleur- en lay-out-attributen heeft het team gemeten hoeveel pixel-per-pixel bewerkingen nodig waren om het kleurenschema of de paginastructuur van de ene website om te zetten in een andere. Voor de AI-gegenereerde attributen hebben ze een machinaal leermodel getraind om afbeeldingen te classificeren op basis van de website waar ze vandaan komen en om de geleerde attributen te meten.

Gelijkenissen qua website

Uit het onderzoek bleek dat over alle drie de metrieken (kleur, lay-out en AI-gegenereerde attributen) de gemiddelde verschillen tussen de websites tussen 2008 en 2010 een piek bereikten en vervolgens tussen 2010 en 2016 afnamen. Van de drie metrieken zijn de lay-outverschillen het meest afgenomen; daar heeft een daling van 30 procent plaatsgevonden.

De bevindingen bevestigen dat websites inderdaad meer op elkaar lijken, maar niet omdat site-eigenaren elkaars code kopiëren. In feite is de gelijkenis in code in de loop van de tijd zelfs aanzienlijk afgenomen, terwijl het gebruik van softwarebibliotheken sterk is toegenomen. Deze softwarebibliotheken bevatten verzamelingen van generieke code die door site-eigenaren worden gebruikt voor veelvoorkomende taken. Denk hierbij aan het verkleinen van een pagina voor mobiel of het toevoegen van een hamburgermenu dat in en uit schuift.

Uit het rapport blijkt ook dat sites met gemiddelde gelijksoortige scores in 2005 minder op elkaar leken vergeleken met sites met een gemiddelde gelijksoortige scores in 2016.

Websites die steeds meer op elkaar lijken is zowel een goede als een slechte zaak. Aan de ene kant zijn gelijksoortige sites toegankelijker voor gebruikers die een nieuwe site bezoeken. Zo weten zij sneller hoe ze ermee moeten omgaan, maar aan de andere kant zit er nu minder 'creativiteit' in het ontwerpen van een website om deze uniek te maken.

