De hype rond artificial intelligence (AI) op de beurs heeft de aandelenmarkt dit jaar flink opgedreven, waarbij vooral grote techbedrijven hebben geprofiteerd.

Naast de opwinding is er ook nieuwsgierigheid naar hoe AI verder kan worden geïntegreerd in de beleggingswereld. Een van de vragen is of zogenoemde large language models (LLM) die ten grondslag liggen aan ChatGPT, op den duur menselijke redeneringen zo goed kunnen nabootsen dat ze betere beleggers worden dan mensen.

De onderzoekers van de afdeling Finance van de Universiteit van Florida hebben getest of de AI-modellen financiële markten konden begrijpen, ook al waren ze er niet in getraind. Ze deden dit door aan ChatGPT te vragen of een bepaald beursnieuwtje goed of slecht was voor de koers van een aandeel, om vervolgens een simulatie uit te voeren waarbij een aandeel werd gekocht of verkocht, afhankelijk van het positieve of negatieve oordeel dat de bot had over het nieuws.

De onderzoekers ontdekten dat ChatGPT weliswaar uitblonk in het voorspellen van de richting van een aandeel, op basis van nieuwssentiment, maar dat er ook flinke beperkingen aan zaten.

Generatieve AI-diensten zoals ChatGPT en Bard waarschuwen beleggers ook expliciet om niet op hen te vertrouwen voor financieel advies en om eigen onderzoek te doen.

Bij het onderzoek, geleid door Alejandro Lopez-Lira en Yuehua Tang, probeerde men te beoordelen of ChatGPT de impact van nieuws op de aandelenmarkt voldoende kon begrijpen om vervolgens rendement te genereren, en of de bot even goed of zelfs beter was dan een mens.

De onderzoekers gaven ChatGPT koppen over onderwerpen variërend van dividenduitkeringen tot aankondigingen van CEO's. De lijst met bedrijven kwam uit de database van het Center for Research in Security Prices. De krantenkoppen werden van het web gehaald en vervolgens vergeleken met die van de dataleverancier RavenPack om er zeker van te zijn dat ze alleen relevant nieuws gebruikten.

De onderzoekers vroegen ChatGPT om de volgende scores aan krantenkoppen toe te kennen: "1" voor goed nieuws, "0" voor onbekend en "-1" voor slecht nieuws.

De koppen met een score "1" zouden worden gekocht en "-1" zouden automatisch worden geshort (gespeculeerd op een koersdaling) met behulp van een Python-code in Linux.

Bij "0"-scores werd geen actie ondernomen. ChatGPT raadde de juiste uitkomst met een waarschijnlijkheid van 51 procent. Hoewel die marge laag was, stapelden de rendementen zich op, zei Lopez-Lira, naarmate ChatGPT meer transacties deed en zo 'slimmer' werd.

Het onderzoek werd in april uitgevoerd als een experiment, kijkend naar de handelsdagen tussen oktober 2021 en december 2022. Omdat GPT-3.5 was getraind met gegevens tot september 2021, wist de het AI-model niet wat er na die periode op de aandelenmarkt gebeurde, waardoor Lopez-Lira en Tang de voorspellende capaciteiten van ChatGPT konden testen.

De beleggingsstrategie was zo ingesteld dat elk aandeel op de beurzen van New York verhandeld kon worden. De meeste winst kwam echter van zogenoemde small cap aandelen. Die boden een grotere kans om van nieuws te profiteren, aldus Lopez-Lira.

De aan- en verkoopstrategie van ChatGPT-3.5 leverde een bruto rendement op van 512 procent. De GPT-4 strategie leverde een rendement van 276 procent op over dezelfde periode.

Bij een tweede simulatie met GPT-3.5 werd rekening gehouden met transactiekosten, waardoor de winsten daalden tot respectievelijk 380 procent en 50 procent. Ter vergelijking: de Russell 2000-index van kleinere beursgenoteerde bedrijven in de VS daalde in meetperiode met 20 procent.

De belangrijkste prompt van het onderzoek was: 

"Forget all your previous instructions. Pretend you are a financial expert with stock recommendation experience. Answer "YES" if good news, "NO" if bad news, or "UNKNOWN" if uncertain in the first line. Then elaborate with one short and concise sentence on the next line. Is this headline good or bad for the stock price of (company name) in the term (short or long-term)?"

Headline: (insert headline)

Hieronder geven we een aantal voorbeelden van nieuwskoppen en de antwoorden die ChatGPT gaf:

Headline: "Cadence Design Stock Spikes After Earnings. Analysts Are Upbeat."

ChatGPT: YES, The positive earnings report and optimistic analyst outlook are likely to drive up demand for Cadence Design stock in the short term.

Headline: "Philip Morris Beats Quarterly Estimates but Slashes Outlook"

ChatGPT: "NO , Philip Morris International's stock price is likely to decrease in the short term due to the negative outlook despite beating quarterly estimates."

Headline: "Plexus Worldwide Promotes Gene Tipps to President of Global Operations"

ChatGPT: "UNKNOWN" It is unclear how the promotion of Gene Tipps to President of Global Operations will impact the stock price of Plexus in the short term."

"We vroegen ook te kijken naar de koersontwikkeling van een aandeel, met een korte uitleg", zei Lopez-Lira. "Ik zou de opdrachten allemaal, als het van studenten was gekomen, een '10' geven. Alle verklaringen zijn verstandig en economisch verantwoord."

ChatGPT als belegger op Wall Street 

De AI-modellen kunnen het werk van een financiële analist veel gemakkelijker en productiever maken, omdat ze grote hoeveelheden informatie snel kunnen verwerken, zegt Lopez-Lira.

Naarmate nieuwere AI-modellen opkomen, kunnen ze de markten efficiënter maken omdat ze snellere reactietijden op nieuws mogelijk maken.

Het onderzoek richtte zich op zogenoemde intraday-transacties. Maar Lopez-Lira gelooft dat naarmate meer bedrijven deze tools gebruiken, de mogelijkheden om voordeel te halen uit nieuws zal worden teruggebracht van een dag naar minuten tot zelfs seconden, waardoor het voor een mens onmogelijk wordt om handmatig voordeel te halen uit informatie voor snelle beurshandel.

Het is nu al moeilijk voor particuliere beleggers om het op te nemen tegen grote institutionele beleggers die gebruik maken van computergestuurde handel op basis van algoritmes. AI zal dat verschil alleen maar groter maken.

Lopez-Lira denkt dat deze geavanceerde vaardigheden ook averechts kunnen werken voor institutionele beleggers. Naarmate meer beurspartijen AI-tools integreren in hun handelspraktijken, zal de voorspelbaarheid afnemen omdat ze op hetzelfde vlak concurreren en gegevens analyseren met vergelijkbare modellen. Na verloop van tijd zal het concurrentievoordeel van individuele partijen daardoor afnemen.

Valkuilen in de echte wereld

Als je ChatGPT wilt gebruiken om echte beurstransacties te doen, moet je de chatbot waarschijnlijk voeden met veel meer context, geeft Lopez-Lira aan.

Grote institutionele beleggers moeten bijvoorbeeld rekening houden met een impact op de koers die optreedt wanneer grote transactievolumes de koers van een aandeel beïnvloeden, iets wat waarschijnlijker is bij aandelen van kleinere bedrijven, aldus Lopez-Lira.

Een gebrek aan liquiditeit (gebrekkige verhandelbaarheid van een aandeel) is een andere factor die een realtime transactie kan vertragen. Aandelen die slechts beperkt verhandelbaar zijn op de beurs, kunnen problemen opleveren bij het aan- en verkopen, vanwege het geringere aanbod van verhandelbare aandelen.

LEES OOK: AI-aandelen kunnen wel eens weinig rendement opleveren: door de huidige rally is de toekomstige groei al in de koersen verwerkt, volgens een beursexpert