Mettiti in comunicazione con noi

Società

I Diplomati nelle Regioni Italiane

Tra il 2005 ed il 2019 sono aumentati del 28,77%

Pubblicato

su

Tra il 2005 ed il 2019 sono aumentati del 28,77%

*Immagini elaborate dell’autore Angelo Leogrande.

L’Istat-BES calcola il valore della percentuale di persone che hanno completato almeno la scuola secondaria superiore sul totale delle persone che hanno tra i 25 ed i 64 anni.

Ranking delle regioni italiane per numero di persone con almeno il diploma. L’Umbria è al primo posto per valore delle persone con almeno il diploma con un valore pari a 71,3, seguita dal Lazio con un valore pari a 70,3 unità e dal Friuli-Venezia Giulia con un ammontare pari a 70,1 unità. A metà classifica vi sono le Marche con un valore pari a 65,3, la Toscana con un valore pari a 64,8 unità ed il Veneto con un valore pari a 64,7 unità. Chiudono la classifica la Campania con un valore pari a 52,9 unità, seguita dalla Sicilia con un valore pari a 51,8 unità e dalla Puglia con un valore pari a 51,3 unità.

Ranking delle regioni italiane per numero di persone con almeno il diploma tra il 2005 ed il 2019. La Sardegna è al primo posto per variazione percentuale delle persone con almeno il diploma tra il 2005 ed il 2020 con un valore pari a 37,91% ovvero pari ad un ammontare di 14,9 unità, seguita dal Veneto con un valore pari a 37,08% pari ad un ammontare di 17,5 unità, e dalla Valle d’Aosta con un valore pari a 36,04% pari ad un ammontare di 16,4 unità. A metà classifica vi sono il Piemonte con un ammontare pari a 30,93% ed un valore pari a 15 unità, seguito dalla Puglia con un valore pari a 28,25% pari ad un ammontare di 11,3, e dal Molise con un valore pari a 26,98% pari ad un ammontare di 13,3 unità. Chiudono la classifica la Liguria con un valore pari a 21,52% pari ad un ammontare di 12,2 unità, il Lazio con un valore pari a 18,55% pari ad un ammontare di 11 unità e la Calabria con una variazione pari ad un ammontare di 17,38% pari ad un ammontare di 8,1 unità. Complessivamente il valore in media delle persone con il diploma è cresciuto di un ammontare pari a 28,77% pari ad un ammontare di 14 unità.

Macro-Regioni Italiane. Il numero di diplomati nel Nord Italia è cresciuto nel periodo tra il 2004 ed il 2019 da un ammontare di 50,50 unità fino ad un valore di 65,70 unità ovvero una variazione pari ad un ammontare di 15,20 unità pari ad un ammontare di 30,10%. Nel Centro Italia il valore del numero dei diplomati è cresciuto da un ammontare di 54,90 unità fino ad un valore di 68,10 unità ovvero pari ad una variazione di 13,20 unità pari ad un ammontare di 24,04%. Il numero di diplomati nel Mezzogiorno è cresciuto da un ammontare di 42,70 unità fino ad un valore di 54,00 unità ovvero pari ad una variazione di 11,30 unità pari ad un valore di 26,46%. Complessivamente il valore dei diplomati nelle macro-regioni italiane tra il 2004 ed il 2019 è cresciuto da un ammontare di 48,70 unità fino ad un valore di 62,20 unità ovvero pari ad una variazione di 13,50 unità pari al 27,72%.

Clusterizzazione con algoritmo k-Means ottimizzato con il coefficiente di Silhouette. Di seguito viene presentato un modello di clusterizzazione attraverso l’utilizzo dell’algoritmo k-Means ottimizzato con il coefficiente di Silhouette. L’analisi mette in risalto l’esistenza di due diversi clusters ovvero:

  • Cluster 1: Emilia-Romagna, Friuli-Venezia Giulia, Marche, Abruzzo, Lombardia, Trentino-Alto Adige, Liguria, Umbria, Lazio, Veneto, Piemonte, Toscana, Molise, Basilicata;
  • Cluster 2: Sicilia, Sardegna, Campania, Puglia, Calabria, Valle d’Aosta.

Dal punto di vista della mediana dei clusters è possibile osservare che il valore mediano del cluster 1-C1 è pari ad un ammontare di 66,5 unità mentre il valore mediano del cluster 2-C2 è pari a 53,55 unità. Ne deriva il seguente ordinamento dei clusters ovvero C1=66,5>C2=53,55. Dal punto di vista geografico vi è quindi una distinzione tra Centro-Nord Italia con valori elevati del numero dei diplomati e Sud Italia con valori ridotti. Tuttavia, non tutte le regioni del Sud Italia fanno parte del secondo clusters, ve ne sono anche talune che sono ricomprese nel primo cluster come per esempio Molise, Basilicata ed Abruzzo. Inoltre, il Cluster 2-C2 non è solo comprensivo delle regioni meridionali ed infatti comprende anche la Valle d’Aosta. È comunque possibile rinvenire una sostanziale contrapposizione tra Centro-Nord e Sud Italia che offre un’ulteriore specificazione, questa volta di tipo scolastico, alla tradizionale determinazione economico-finanziaria del divario italiano.

Network analysis con l’utilizzo della distanza di Manhattan. Di seguito viene utilizzato il metodo della distanza di Manhattan per verificare la presenza di strutture a network nella struttura dei dati relativi alla presenza di diplomati nelle regioni italiane. L’analisi mostra la presenza di una struttura a rete complessa e di 4 strutture semplificate. La struttura complessa è complessa è composta da Sicilia, Puglia e Sardegna. In modo particolare esistono le seguenti relazioni ovvero:

  • La Sicilia ha una connessione con la Puglia pari ad un valore di 0,6, ed un link con la Sardegna pari ad un valore di 0,44 unità;
  • La Sardegna ha una relazione con la Puglia per un valore pari a 0,47 e con la Sicilia per un valore pari a 0,44;
  • La Puglia ha una relazione con la Sicilia per un valore pari a 0,6 e con la Sardegna con un valore pari a 0,47.

Inoltre, sono presenti le seguenti strutture semplificate ovvero:

  • La Basilicata ed il Molise sono connessi con un valore del link pari ad un ammontare di 0,5 unità;
  • Emilia-Romagna e Friuli-Venezia Giulia sono connessi con un valore del link pari a 0,42 unità;
  • Veneto e Piemonte sono connessi con un link avente valore pari a 0,55 unità;
  • Marche e Lombardia sono connesse con un link avente un valore pari a 0,25 unità.

La struttura a network complessa se paragonata alla clusterizzazione sembra confermare la presenza di una relazione tra alcune regioni meridionali ovvero Sardegna, Puglia e Sicilia, mentre dall’altro lato le relazioni tra le regioni del cluster 1 sono sfilacciate e mancano di presentare elementi di complessità.

Machine Learning and predictions. Di seguito viene ad essere realizzato un modello di machine learning per la predizione del valore futuro dei diplomati nelle regioni italiane. Vengono considerati 10 algoritmi analizzati sulla base della capacità di minimizzare gli errori statistici MSE, RMSE, MAE e di massimizzare R2. Gli algoritmi sono stati addestrati attraverso l’utilizzo dell’80% dei dati mediante l’utilizzo della cross validation. In base a tale classificazione viene quindi presentata la seguente classifica degli algoritmi ovvero:

  • SGD con un valore del payoff pari a 4;
  • kNN con un valore del payoff pari a 10;
  • Random Forest con un valore del payoff pari a 11;
  • Gradient Boosting con un valore del payoff pari a 15;
  • Linear Regression con un valore del payoff pari a pari a 21;
  • AdaBoost con un valore del payoff pari a 23;
  • Tree con un valore del payoff pari a 28;
  • SVM con un valore del payoff pari a 32;
  • Costant con un valore del payoff pari a 36;
  • Neural Network con un valore del payoff pari a 40.

Attraverso l’utilizzo dell’algoritmo maggiormente performante ovvero SGD è quindi possibile verificare le regioni che sono winners and losers in termini di crescita o riduzione del numero dei diplomati. L’algoritmo SGD predice le seguenti regioni winners-ovvero regioni che hanno un valore del numero dei diplomati predetto in crescita:

  • Calabria con una crescita da 54,7 unità fino ad un valore di 56,92 unità ovvero pari ad un  valore di 2,22 unità pari ad un valore di 4,06%;
  • Campania con una variazione da 52,9 unità fino ad un valore di 54,57 unità ovvero pari ad un valore di 1,67 unità pari ad un valore di 3,16%;
  • Lazio con una variazione da un ammontare di 70,3 unità fino ad un valore di 72,37 unità ovvero una crescita di 2,07 unità pari  ad un ammontare di 2,94%;

Inoltre di seguito vengono ad essere indicate le variazioni diminutive più significative, ovvero quelle regioni losers, ossia regioni per le quali l’algoritmo SGD predice una variazione diminutiva rilevante. Tali regioni sono:

  • Valle d’Aosta con una variazione da un ammontare di 61,9 unità fino ad un valore di 60,21 unità ovvero pari ad una variazione di -1,69 unità pari ad una variazione di -2,73%;
  • Friuli Venezia Giulia con una variazione da un ammontare di 70,14 fino ad un valore di 68,11 unità ovvero pari ad una variazione di -2,03 unità pari ad un valore di -2,89%;
  • Sardegna con una variazione diminutiva da un ammontare di 54,2 unità fino ad un valore di 51,84 unità ovvero pari ad una variazione di -2,36 unità ovvero pari ad una variazione di -4,35%.

Tuttavia è possibile anche utilizzare gli algoritmi per calcolare la probabilità di una regione di superare il valore medio italiano per numero di diplomati. In questo caso viene costruita una nuova variabile costituita dalla differenza tra il valore medio del numero di diplomati in Italia ed il numero di diplomati per regione. Nel caso in cui la variazione sia positiva viene assegnato un valore pari a 1 in caso contrario viene assegnato un valore pari a 0. In questo senso gli algoritmi vengono analizzati in termini di accuracy. L’analisi mostra la presenza dei seguenti ordinamenti in termini di accuracy ovvero:

  • Gradient Boosting, AdaBoost, Naive Bayes hanno un valore di accuracy pari a 1;
  • kNN, Tree, Random Forest, SVM, Neural Network, CN2 Rule Inducer, Logistic Regression e SGD hanno un valore di accuracy pari a 0,95;
  • Costant ha un valore di accuracy pari a 0,7.

Conclusioni. L’analisi mostra che il numero dei diplomati nelle regioni italiane è significativamente aumentato tra il 2005 ed il 2019. Tuttavia, vi sono delle significative distinzioni tra Centro-Nord Italia e Sud Italia in termini di numero di diplomati. In modo particolare se da un lato nelle regioni del Nord Italia nella popolazione tra 25 e 64 anni vi sono circa 66 diplomati su 100 persone tale valore risulta essere di 54,00 su 100 nelle regioni del Mezzogiorno. Ovvero per ogni 100 persone nella fascia di età 25-64 anni nel Nord Italia vi sono 12 diplomati in più rispetto al Mezzogiorno. Ovviamente questi dati sono di tipo quantitativo e non hanno la capacità di mettere in evidenza quelle che sono invece le differenze di tipo qualitativo, che pure esistono, dei modelli di insegnamento tra Nord e Sud Italia. Inoltre occorre considerare che tali valori non prendono neanche in considerazione le tipologie di istituzioni scolastici frequentati dagli studenti. I diplomati nel Mezzogiorno sono quindi di meno rispetto a quelli del Nord Italia e molto probabilmente hanno anche un tipo di formazione qualitativamente ridotta con delle strutture scolastiche tendenzialmente meno adeguate. Inoltre, occorre considerare che ovviamente un minore numero di diplomati tende a riflettersi anche in termini di riduzione del numero degli studenti iscritti nelle istituzioni universitarie. Infine, è necessario rilevate che i dati analizzati fanno riferimento al 2019 e che probabilmente tali valori sono significativamente peggiorati nel corso della pandemia del covid 19. Infatti, i lockdown e le forme di didattica a distanza hanno sostanzialmente peggiorato la qualità della formazione scolastica e hanno promozionato il fenomeno dell’abbandono scolastico. Infine, è assai probabile che il basso numero di diplomati nel Sud Italia rispetto alle altre aree d’Italia rifletta una condizione più grave della popolazione meridionale ovvero il fatto di non vedere più nella scuola e nella formazione un elemento essenziale per la crescita economica, sociale, civile, individuale e collettiva. Uno scetticismo nei confronti della cultura che rischia di gravare ancora di più sul ritardo del Mezzogiorno soprattutto nell’attuale contesto economico internazionale caratterizzato dal dominio dell’economia della conoscenza e dell’innovazione tecnologica. A tal proposito è quindi necessario che le politiche economiche italiane ed europee diano maggiori risorse all’economie del Mezzogiorno per fare in modo che il numero dei diplomati del Sud Italia raggiunga almeno il livello medio.

RIPRODUZIONE RISERVATA ©

is Assistant Professor at the LUM University-Giuseppe Degennaro in Casamassima-Bari, where he is also researcher for the LUM Enterprise S.r.l. a firm oriented to develop digitalization services for SMEs. He worked at Dyrecta Lab Research Institute, a research institute officially recognized by the Italian Minister of University and Research-MIUR, where he acquired professional hard skills on the economic consequences of Industry 4.0, Big Data, Machine Learning and Artificial Intelligence. His research interests include Cooperative Banking, Business Ethics, Innovation Technology, Knowledge, and R&D.