In het kort
- DeepSeek heeft een nieuwe techniek ontwikkeld, genaamd self-principled critique tuning (SPCT), die het redeneringsvermogen van grote taalmodellen verbetert.
- Met deze methode kan AI zelfstandig evaluatiecriteria formuleren en diepgaande kritiek leveren, zonder afhankelijk te zijn van grotere modelgroottes.
- Volgens DeepSeek zou deze aanpak hun modellen in staat kunnen stellen om betere prestaties te leveren dan concurrenten zoals Google’s Gemini, Meta’s Llama en OpenAI’s GPT-4.
Een Chinese AI-start-up, DeepSeek, heeft in samenwerking met onderzoekers van de Tsinghua University een nieuwe techniek ontwikkeld om het redeneervermogen van grote taalmodellen (LLM’s) te verbeteren. Deze methode, self-principled critique tuning (SPCT) genoemd, stelt AI in staat om zelf evaluatiecriteria vast te stellen en deze te gebruiken om diepgaande kritiek te leveren.
In plaats van te vertrouwen op grotere modelgroottes, die doorgaans aanzienlijke rekenkracht en menselijke inspanning vereisen, maakt de aanpak van DeepSeek gebruik van een systeem met een geïntegreerde “rechter” die de antwoorden van de AI in realtime beoordeelt. Wanneer een vraag wordt gesteld, vergelijkt deze beoordelaar het beoogde antwoord van de AI met zowel de interne principes als de kenmerken van een gewenst antwoord.
DeepSeeks GRM en AI-revolutie
De AI ontvangt positieve feedback wanneer het gegenereerde antwoord goed overeenkomt met deze benchmarks, wat voortdurende verbetering mogelijk maakt. DeepSeek noemt dit zelfverbeterende systeem DeepSeek-GRM.
De onderzoekers beweren dat deze techniek modellen in staat zou kunnen stellen de prestaties van concurrenten zoals Google’s Gemini, Meta’s Llama en OpenAI’s GPT-4 te overtreffen. DeepSeek is van plan om deze geavanceerde AI-modellen als open-source software beschikbaar te stellen, hoewel er nog geen specifieke releasetijdlijn is aangekondigd.
De publicatie van dit onderzoek komt op hetzelfde moment als speculaties over de aanstaande onthulling van DeepSeeks nieuwste R2-chatbot. Het bedrijf heeft echter besloten de release voorlopig niet publiekelijk te bevestigen.
