Wat is RAG?

Wat is RAG?
W

9

We kunnen er niet meer omheen: AI is echt een blijvertje. Toch heeft het gebruik van AI ook zijn scherpe randjes. Neem bijvoorbeeld de recente misinformatie die LLM’s ons nog regelmatig voorschotelen. Dat ‘halucineren‘ is nog steeds een smet op de naam van generatieve AI.

Retrieval-augmented generation (RAG) kan daar een eind aan maken. Het omvat een techniek die de nauwkeurigheid en betrouwbaarheid van generatieve AI-modellen moet verbeteren door feiten real time uit externe bronnen bijeen te zoeken. Deze extra functie zorgt ervoor dat wat wij door een LLM krijgen voorgeschoteld, getoetst is bij bronnen die géén deel uitmaken van de getrainde data van de LLM maar toch de laatst bekende informatie bevatten.

Patrick Lewis, die RAG al in 2020 beschreef in dit artikel, leidt momenteel een RAG-team bij AI-startup Co:here. Terugkijkend op die periode is het enige wat hij betreurt de naamgeving van de techniek, omdat het woord zoveel betekent als ‘versleten’.

Een groot voordeel van RAG is dat het relatief eenvoudig toepasbaar is. In een blog van Lewis wordt gesteld dat ontwikkelaars het proces kunnen implementeren mbv een token met slechts vijf regels code.

Toepassing

Een generatief AI-model, aangevuld met een medische index, kan een geweldige assistent zijn voor een arts of verpleegkundige. Financiële analisten kunnen hebben voordeel bij een assistent, die gekoppeld is aan de laatste marktgegevens. In feite kan bijna elk bedrijf zijn technische of beleidshandleidingen, video’s of logboeken omzetten in bronnen die kennisbanken worden genoemd en die LLM’s kunnen verbeteren (trainen). Dat is de reden waarom bedrijven als AWS, IBM, Glean, Google, Microsoft, NVIDIA, Oracle en Pinecone RAG gebruiken.