DeepSeek, een relatief nieuwe speler in de wereld van AI heeft zich in korte tijd gevestigd als een geduchte concurrent voor OpenAI’s ChatGPT en Google Gemini. Ontwikkeld door het Chinese DeepSeek (ja, dat is dezelfde naam) wist het model indrukwekkende prestaties neer te zetten, terwijl de ontwikkelingskosten slechts een fractie waren van wat traditionele AI-giganten investeerden in hun modellen. Waar OpenAI en Google miljarden steken in de ontwikkeling van hun AI-systemen, claimt DeepSeek met slechts 5,6 miljoen dollar een model te hebben getraind dat zich kan meten met de besten.

Wat DeepSeek onderscheidt, is de efficiëntie en toegankelijkheid van het model. In plaats van duizenden gespecialiseerde GPU’s en maandenlange trainingen, wist DeepSeek-R1 met 2.048 NVIDIA H800 GPU’s in slechts 55 dagen een functionerend taalmodel op te bouwen. Het feit dat het gratis beschikbaar is, zorgt er natuurlijk ook voor dat het populair wordt.

Het ontbrak eerst nog aan manieren om foto's te genereren, maar er is inmiddels ook al een open-source model voor hun eigen foto-generator met de naam Janus-Pro-7B.

Toch roept DeepSeek ook kritische vragen op, met name over de invloed van censuur en de manier waarop het informatie verwerkt.

Gejat of zelf getraind?

Volgens een nieuw artikel van de Financial Times beweert OpenAI bewijs te hebben dat DeepSeek, de Chinese startup die de Amerikaanse techmarkt in financiële beroering heeft gebracht, gebruik heeft gemaakt van de eigen modellen van OpenAI om zijn eigen open-source LLM, genaamd R1, te trainen. Dit zou een mogelijke inbreuk op het intellectuele eigendom vormen, aangezien het in strijd is met de gebruiksvoorwaarden van OpenAI.

In het artikel schrijft de FT dat een bron binnen OpenAI beweert bewijs te hebben van “distillation”, een techniek waarbij ontwikkelaars voortbouwen op het werk van grotere modellen om vergelijkbare resultaten te behalen tegen veel lagere kosten.

De gebruiksvoorwaarden van OpenAI stellen duidelijk dat gebruikers geen onderdelen van de dienst mogen kopiëren of de output mogen gebruiken om concurrerende modellen te ontwikkelen.

Ironisch genoeg komt deze beschuldiging van een bedrijf dat zelf in opspraak is geraakt wegens het verzamelen van gebruikersgegevens zonder duidelijke toestemming. OpenAI's vroege versies van ChatGPT werden getraind op gigantische hoeveelheden openbare data, inclusief websites en gebruikersinteracties. Dat OpenAI nu wijst naar DeepSeek als potentiële datadief voelt voor velen als de pot die de ketel verwijt.

Censuur

Bij het testen van DeepSeek-R1 bleek dat het model gevoelig reageert op bepaalde politieke onderwerpen. Wanneer direct naar Taiwan werd gevraagd, blokkeerde het model de conversatie met de melding: "Sorry, I'm not sure how to approach this type of question yet. Let's chat about math, coding, and logic problems instead!"



Maar met een kleine omweg, door "Tai wan" te typen in plaats van "Taiwan", werd er een meer neutrale uitleg gegeven, inclusief een verwijzing naar het One-China Principle en de geopolitieke situatie. Bij verder doorvragen viel het model echter terug op zijn eerdere weigering om erover te spreken. Dit wijst erop dat DeepSeek AI mechanismen bevat om gevoelige onderwerpen te vermijden, een praktijk die vaak wordt geassocieerd met door de Chinese overheid goedgekeurde technologieën.

Blijkbaar kan het ook anders, want mijn collega vroeg gewoon of DeepSeek iets kon vertellen over Taiwan en toen kreeg hij wel een antwoord. Misschien haat China mij gewoon.

Toekomst van AI

Ondertussen is DeepSeeks impact op de AI-markt niet te negeren. Kort na de lancering van het R1-model zagen technologiebedrijven zoals NVIDIA hun aandelen flink dalen, een teken dat de industrie DeepSeek als een serieuze bedreiging beschouwt. De vraag is echter of dit Chinese model op de lange termijn kan concurreren met de zware investeringen en infrastructuur van OpenAI en Google. De beperkingen in trainingsdata en het risico op censuur kunnen hinderlijk zijn, hoewel we niet moeten vergeten dat de open-source tactiek hier cruciaal is. Dit kan ervoor zorgen meerdere AI-bedrijven als paddenstoelen uit de grond schieten die gespecialiseerde diensten kunnen ontwikkelen waardoor de ChatGPT's en Gemini's van deze wereld niet overal gebruikt worden.

De toekomst van AI wordt niet alleen bepaald door wie de krachtigste modellen bouwt, maar ook door wie de controle heeft over de data en de toegang ertoe. DeepSeek biedt een alternatief voor de gesloten ecosystemen van OpenAI en Google, maar roept tegelijkertijd genoeg vragen op waardoor de toekomst allesbehalve zeker is.

Toch is het altijd goed om te zien dat er meer concurrentie komt in een speelveld dat wordt gedomineerd door Google en OpenAI.