• ChatGPT, een chatbot die met behulp van grote taaldatabases plausibel klinkende antwoorden geeft, is omgeven door een enorme hype in de media.
  • Maar de bot die op toepassingen van artificial intelligence draait, gebruikt onderliggend revolutionaire trainingssoftware.
  • Het efficiënt trainen van software die gebruik maakt van grote taaldatabases is, één van de grote uitdagingen voor toepassingen van kunstmatige intelligentie.
  • Lees ook: Als ChatGPT zo slim is, waarom is de chatbot van de bank dan zo dom?

De online vraagbaak ChatGPT, een bot die werkt op basis van kunstmatige intelligentie-software, heeft een enorme hype veroorzaakt op internet. De antwoorden die ChatGPT genereert zijn gedetailleerd en ogen vaak levensecht.

Startup OpenAI kreeg veel aandacht, toen het bedrijf ChatGPT voor het brede publiek openstelde. Maar de bot draait onderliggend op applicaties van een ander bedrijf die cruciaal zijn voor de revolutionaire ontwikkelingen rond artificial intelligence.

Startup Anyscale heeft met de applicatie Ray de basis gelegd om ChatGPT op een efficiënte manier te trainen om plausibele antwoorden te genereren met behulp van grote taaldatabases.

Voordat OpenAI gebruik ging maken van Ray, werkte het bedrijf achter ChatGPT met een reeks trainingsmodellen die allemaal duidelijke beperkingen hadden. De overstap naar Ray heeft echter veel problemen verholpen, zei directeur Greg Brockman van OpenAI eerder dit jaar bij een conferentie.

Artificial intelligence-startup Anyscale gewaardeerd op 1 miljard dollar

Anyscale werd bij een recente investeringsronde op meer dan 1 miljard dollar gewaardeerd, aldus goed geïnformeerde bronnen tegen Insider.

"De ontwikkelingen op het gebied van kunstmatige intelligentie gaan razendsnel. Er worden steeds nieuwe dingen uitgeprobeerd", geeft topman Robert Nishihara van Anyscale desgevraagd aan. "ChatGPT heeft een hoop inzichten op het gebied van grote taaldatabases gecombineerd. Onderliggend heb je een infrastructuur nodig om verschillende algoritmes te kunnen laten opschalen bij het gebruik van databases. Daar biedt Ray veel flexibiliteit."

Ray maakt het eenvoudiger om de softwaremodellen waar bedrijven als OpenAI mee werken, te trainen met honderden miljarden gegevens, om antwoorden te genereren die levensecht ogen.

Ray: een trainingsmodel voor AI-software

De trainingsmodules van Ray zorgen voor een efficiënte distributie van de computerkracht die nodig is bij het zogenoemde machine learning.

Bij ai-software die gebruik maakt van machine learning worden in eerste instantie vaak beperkte datasets gebruikt om een model te maken dat bijvoorbeeld kan voorspellen of iemand een product wel of niet blijft kopen.

In het geval van ChatGPT kan een model niet met één laptop worden getraind. Er moet gebruik gemaakt worden van verschillende computerservers met grote databases om de ai-software te trainen. Dat moet ook zo gecoördineerd worden dat de verschillende hardware-onderdelen goed met elkaar samenwerken. Ray biedt daar een oplossing voor door te bepalen hoe datastromen worden gecoördineerd en welke stappen er gezet worden, als er dingen fout gaan.

Ray is zeker niet de enige nieuwe tool voor machine learning. Google werkt bijvoorbeeld met het zogenoemde JAX-framework. Velen verwachten dat dit de basis wordt van de machine learning-applicaties van Google.

Uiteindelijk gaat het om verschillende applicaties die zogenoemde 'large language models' ondersteunen, waarbij zinsstructuren worden geanalyseerd op basis van miljarden datapunten, om vervolgens menselijk ogende zinnen te produceren op basis van zoekvragen.

LEES OOK: We vroegen de door artificial intelligence aangestuurde bot ChatGPT welke aandelen het goed gaan doen in 2023: dit was het antwoord