Sinds de komst van ChatGPT is het voor iedereen mogelijk om met krachtige kunstmatige intelligentie te experimenteren. De technische werking van de baanbrekende chatbot blijft echter een goed bewaard geheim.
Pogingen om AI meer ‘open’ te maken zijn in een stroomversnelling geraakt. In mei 2023 lekte iemand een model van Meta, Llama, dat buitenstaanders toegang gaf tot de onderliggende code en het gewricht dat bepaalt hoe het zich gedraagt.
In juli 2023 brengt Meta een nog krachtiger model, Llama 2, uit voor een breed publiek. Sindsdien is het model heel populair geworden bij bedrijven, onderzoekers en hobbyisten die tools en applicaties bouwen met ChatGPT-achtige functionaliteit. Sinds kort heeft Meta zelfs een nieuw AI model uitgebracht met de naam ‘Code Llama’ [en], dat is afgestemd op programmeren/codering.
Het begint er dus op te lijken dat open-source een vergelijkbare impact gaat krijgen op AI. Taalmodellen die worden vrijgegeven onder normale open source-licenties zoals GPT Neo (EleutherAI), zijn volgens onderzoekers al volledig ‘open source’. Met toch een paar beperkingen:
- De gegevens die nodig zijn om geavanceerde modellen te trainen worden vaak geheim gehouden.
- Software-framewerken die nodig zijn om dergelijke modellen te bouwen, worden vaak beheerd door grote bedrijven zoals TensorFlow en Pytorch, die op hun beurt weer worden beheer(s)d door Google en Meta.
- De kosten van computerkracht die nodig is om een groot model te trainen zijn te hoog voor een normale ontwikkelaar of bedrijf (tientallen of honderden miljoenen dollars).
- De arbeidskosten om dit soort modellen te verfijnen en te verbeteren zijn alleen op te brengen door kapitaalkrachtige bedrijven (het is interessant om te vermelden dat deze activiteiten al door AI zelf worden overgenomen).