Blog - Ultime notizie
L'intelligenza artificiale per prevedere il successo delle startup

Prove di valutazione di azienda con AI

Prove di valutazione di azienda con AI

L’intelligenza artificiale per prevedere il successo delle startup

In un paper pubblicato a inizio settembre, dal titolo accattivante “A Fused Large Language Model for Predicting Startup Success di Abdurahman Maarouf, Stefan Feuerriegel e Nicolas Pröllochs si affronta il tema della previsione del successo delle startup utilizzando un modello di machine learning basato su un “large Language Model” (LLM) fuso con variabili strutturate.

In questo studio [ segnalatomi da Stefano Gatti nella sua interessantissima newsletter “La cultura del dato“], attraverso l’analisi di dati non strutturati (principalmente i profili aziendali su Crunchbase), sembra essere migliorata la previsione del successo o meno di circa 20.000 start-up. E l’incremento nell’accuratezza della previsione sembra decisamente rilevante (più del 2%).

Questa ricerca è particolarmente rilevante per gli investitori interessati ad identificare opportunità di investimento redditizie.

La ricerca è ancora in fase sperimentale e l’invito è quello di restare curiosi su uno strumento che potrà avere interessanti potenzialità.

Ovviamente resta tutta da vedere la robustezza del modello nel futuro (o meglio nei futuri) in un momento di alta dinamicità degli scenari mondiali.

Prove di valutazione di azienda con AI - L'intelligenza artificiale per prevedere il successo delle startup Share on X

Obiettivi e Metodologia

L’obiettivo dello studio è predire il successo delle startup utilizzando i profili presenti sulle piattaforme di venture capital (VC) come Crunchbase. Lo studio considera due fonti di dati principali:

  1. Variabili Fondamentali (FV) : dati strutturati come l’età della startup, il numero di fondatori ei finanziamenti ricevuti.
  2. Descrizioni Testuali (TSD) : descrizioni libere del modello di business della startup e delle innovazioni offerte.

Per migliorare la capacità di previsione, è stato sviluppato un modello di machine learning che fonde le variabili fondamentali con le descrizioni testuali utilizzando un modello linguistico pre-addestrato (BERT). Il modello si basa sull’approccio di concatenare gli embedding delle descrizioni testuali alle variabili fondamentali e successivamente utilizzarle per addestrare un classificatore.

Risultati chiave

L’analisi si basa su un set di dati di 20.172 profili di startup su Crunchbase. I risultati dimostrano che:

  • Utilizzando solo le variabili fondamentali, l’accuratezza bilanciata è del 72%, mentre aggiungendo le descrizioni testuali, l’accuratezza aumenta al 74,33%.
  • Il miglioramento statistico suggerisce che le descrizioni testuali sono molto efficaci nel migliorare la capacità predittiva del modello.
  • Il ritorno sugli investimenti (ROI) migliora di oltre 40 punti percentuale quando si incorporano le descrizioni testuali.

Applicazioni e implicazioni

  1. Supporto Decisionale per Investitori : Il modello rappresenta uno strumento utile per gli investitori, che possono effettivamente identificare startup con maggiore probabilità di successo.
  2. Machine Learning in Business Analytics : Lo studio mostra l’utilità pratica dei LLM in applicazioni di analisi aziendale, soprattutto per valutare startup in contesti di VC.
  3. Impatto delle Descrizioni Testuali : Le descrizioni testuali delle startup rappresentano una fonte significativa di informazioni che permette di aumentare la precisione delle previsioni.

Sensibilità e Robustezza dei Risultati

Sono state condotte analisi di sensibilità per verificare la robustezza del modello:

  • Settore Industriale : Il modello mantiene un livello elevato di accuratezza anche in settori diversi, sebbene la previsione possa essere meno accurata in alcuni settori con meno startup o con descrizioni meno omogenee.
  • Classificatori Finali : Sono stati valutati diversi classificatori (regressione logistica, elastic net, foresta casuale e reti neurali) con il miglior risultato ottenuto utilizzando una rete neurale.

Conclusioni

Il modello sviluppato dimostra che la combinazione di variabili fondamentali e descrizioni testuali migliora in modo significativo la capacità di predire il successo delle startup. Le descrizioni testuali rappresentano una fonte importante di informazione che consente una valutazione più accurata delle potenzialità di crescita delle startup. Questo lavoro contribuisce alla ricerca sugli investimenti in capitale di rischio, fornendo uno strumento flessibile per supportare il processo decisionale degli investitori.

Tabella Riassuntiva dei Risultati Principali

Metodologia Accuratezza Bilanciata ROI Migliorato
Solo Variabili Fondamentali 72% 670,84%
Variabili + Descrizioni 74,33% 723,09%

Punti di Interesse per Imprenditori e Consulenti

Integrazione di Machine Learning per Decisioni di Venture Capital (VC): La ricerca suggerisce l’importanza di adottare modelli avanzati di machine learning per migliorare la selezione delle startup su cui investire. Tradizionalmente, gli investitori in venture capital basano le loro decisioni su un insieme limitato di informazioni strutturate, come il track record dei fondatori e i finanziamenti precedenti. Tuttavia, questo approccio non sempre riesce a cogliere l’insieme più ampio delle variabili qualitative che influenzano il successo di una startup. Il modello proposto in questo studio, che combina variabili strutturate con descrizioni testuali elaborate tramite modelli linguistici di grande scala, permette di valutare le startup con maggiore precisione, considerando aspetti come il modello di business, il livello di innovazione e la coerenza strategica.

L’utilizzo di un “large language model” (LLM) come BERT per elaborare le descrizioni testuali fornisce una comprensione più approfondita delle startup, superando i limiti degli approcci tradizionali di text mining, come il bag-of-words, che ignorano il significato semantico delle parole e la loro relazione contestuale.

Per gli investitori, questo significa disporre di uno strumento più raffinato per individuare potenziali “unicorni” con una probabilità di successo significativamente più elevata, riducendo i rischi legati agli investimenti in fase iniziale.

Inoltre, l’approccio fuso consente di migliorare la capacità predittiva anche quando le informazioni strutturate sono incomplete o limitate, compensandole con la ricchezza delle descrizioni qualitative fornite dalle startup stesse. In questo contesto, l’applicazione di tecnologie di machine learning è fondamentale non solo per aumentare l’accuratezza delle decisioni d’investimento, ma anche per rendere il processo più scalabile ed efficiente, soprattutto nei casi in cui bisogna analizzare un grande numero di opportunità in tempi rapidi.