Lo stregone dei dati - The data warlock #004
Gestire l'azienda come una "data & technology company", combinando dati e informazioni mediante tecnologie trasformative.
“È mai possibile tracciare una vera distinzione tra i mezzi di comunicazione di massa come strumenti di informazione e di divertimento, e come agenti di manipolazione e di indottrinamento?” (Herbert Marcuse)
Benvenuto alla newsletter dello Stregone dei dati. Seguimi in questo viaggio alla ricerca del tesoro nascosto della competitività di impresa. Saranno necessari molti incantesimi per superare le prove disseminate lungo il percorso, ma non temere: quelli che sembrano sortilegi in realtà sono il risultato dell’applicazione delle tecnologie digitali all’universo di dati che ci circonda.
Il mondo, in fondo, è un’informazione, e questa è la chiave per viverci e prosperare.
Se vuoi partecipare al viaggio, devi solo premere il pulsante Subscribe (Iscriviti). L’abbonamento è gratuito e riceverai la newsletter ogni due settimane, di martedì.
Se poi quello che leggi ti piacerà, puoi senz’altro condividerlo con amici e colleghi.
Vuoi approfondire alcuni temi, conoscermi meglio, o accedere ai miei servizi professionali?
Per me sarà un piacere: manda un’email a alessandro.cederle@thedatawarlock.com.
Democratizzare i dati
E’ possibile “democratizzare i dati”?
Sì, è possibile; così la pensano i propugnatori del cosiddetto data mesh, un modo di organizzare la data science all’interno dell’azienda che sta diventando piuttosto popolare (“gaining traction”, come si dice). Il data mesh, guardato in prospettiva, assomiglia al socialismo. Invece di restituire ai lavoratori la proprietà dei mezzi di produzione, si vuole restituire ai responsabili di prodotto la proprietà dei dati!
Secondo questa prospettiva la struttura, l’architettura complessiva dei dati stessi resta gestita sempre in modo centralizzato, a livello aziendale; ma le “linee” vengono dotate degli strumenti concettuali e operativi per applicare le tecniche di data analytics a contenuti, dati e informazioni, in modo da utilizzarle liberamente per i propri obiettivi di business.
Chiaro? C’è una struttura unica amministrata da un mega stregone, che sovrintende dall’alto la struttura complessiva e assicura che non venga fuori un gran casino; ma all’interno di questa architettura ognuno viene dotato dei mezzi per farsi le sue analisi e utilizzare i dati per generare valore, senza dover chiedere agli specialisti.
Questa impostazione prende le distanze dall’accentramento che è invece tipico di molte organizzazioni tecnologiche, posizionandosi all’altro estremo del continuum che intercorre tra centralizzazione e decentralizzazione.
La centralizzazione gode di pessima fama, sa di burocrazia e di arbitrio di un’élite. In effetti quando un servizio IT è centralizzato (quasi sempre) chi ha bisogno di qualcosa (una nuova feature, un report, un’applicazione, un algoritmo, un comando, la risoluzione di un bug) deve tipicamente rispondere a un sacco di domande e compilare un sacco di moduli, che a volte non vengono neanche letti, perché gli specialisti sono così specialisti da pensare di sapere meglio di te cosa ti serve; dopo di che la tua richiesta viene inserita nella “pipeline” delle “priorities” e puoi metterti comodo e aspettare che venga esaudita. Quando poi verrà pronta perché il vento delle “priorities” ha soffiato in modo a te propizio, può anche darsi che quello che hai chiesto non ti serva più, o comunque non il quel modo, e la giostra ricomincia.
D’altro canto anche la de-centralizzazione ha le sue pecche; genera confusione, incertezza sulle priorità, proliferare di standard che non parlano tra di loro.
Le organizzazioni da sempre pencolano tra efficienza ed efficacia, con un movimento a fisarmonica che a turno dà priorità all’una o all’altra. L’efficienza riflette l’adeguatezza dei costi rispetto agli obiettivi raggiunti ed è chiaramente favorita dalla centralizzazione. L’efficacia, che invece si accompagna volentieri a un certo grado di decentralizzazione, è focalizzata sul raggiungimento veloce degli obiettivi, a qualunque costo, per così dire: portare a casa il risultato anche se mi costa più dello stretto necessario. Margini da una parte, ricavi dall’altra. Equilibrio finanziario vs. crescita. Centralizzazione, decentralizzazione.
In questo momento il pendolo della tecnologia tira verso la decentralizzazione e questa è una bella notizia. Il diffondersi di linguaggi di programmazione “low coding” o addirittura “no coding”, cioè che non richiedono l’apprendimento di un linguaggio informatico, aiuta questa tendenza. Così come la concentrazione delle applicazioni di AI su alcuni specifici algoritmi “coltellino svizzero”: imparati gli algoritmi di base li si adatta volta a volta alle circostanze del problema da risolvere. Il cloud è anch’esso origine e fonte di decentralizzazione. L’open source è decentralizzato per definizione. L’architettura di Internet, per nodi interconnessi, è una celebrazione della decentralizzazione.
Non è facile, tuttavia. In primo luogo la prima risorsa da distribuire sono le competenza, ancor prima di dati e strumenti operativi. E le competenze richiedono tempo per essere acquisite. Il movimento verso le periferie viene poi ostacolato dal modo in cui vengono raccolti e storati i dati, che li rendono di difficile accessibilità. Nelle grandi organizzazioni il movimento verso il decentramento genera livelli di complessità importanti. Chi gestisce un dominio di dati “sul territorio” deve prendersi la responsabilità di mantenerli disponibili e chiaramente definiti, di seguire in modo continuo la struttura dei metadati, di verificarne e svilupparne la qualità, e così via; pena la costituzione di mille piccoli regni, viceregni, ducati e contee, dove tutte le volte che i dati devono oltrepassare una frontiera vengono sottoposti a dazi insopportabili. Insomma, farlo non è come dirlo.
D’altro canto la promessa è formidabile: cosa succederebbe se davvero la possibilità di utilizzare l’intelligenza artificiale fosse disponibile a tutti, in modo distribuito, senza bisogno di competenze avanzate e tecniche specialistiche? Vorrebbe dire dispiegare un potere formidabile, animare tutta l’organizzazione di mille fuochi che producono innovazione, illuminare l’azienda di intelligenza (anche artificiale) distribuita in ogni ufficio e dietro ogni scrivania. Il risultato sarebbe … wow! Noi stregoni facciamo il tifo per il data mesh.
Per approfondire: Data Mesh - Fad or Fab? e Data Domains and Data Products
Data Engineer: chi era costui?
Non è un Database Administrator; non è un Data Analyst; non è un Analytics Engineer; non è un Machine Learning Engineer; e non è un Data Platform Engineer . Ma allora cos’è, o meglio chi è un Data Engineer? (la risposta è nell’articolo di approfondimento, se interessa).
Per approfondire: Stop using the term “Data Engineer”
Carneade! Chi era costui?
C’è un enorme problema di linguaggio che rischia di ostacolare, se non di impedire, la democratizzazione della tecnologia, del digitale e in prospettiva dell’intelligenza artificiale.
I saperi specialisti amano ammantarsi di linguaggi esoterici. Ad esempio i medici, che per dire “mal di pancia” parlano di “algìa gastrica”, e se la pancia fa davvero male allora denunciano una “algìa gastrica acuta”. Oppure i velisti. Provate a salire su una barca a vela e a pronunciare la parola “corda” di fronte allo skipper; se non volete essere scaraventati direttamente fuori bordo, interrogatelo piuttosto con fare interessato sulla differenza tra cime e drizze, scotte, strali e paterazzi.
Ovviamente i temi complessi e articolati hanno bisogno di linguaggi altrettanto articolati, precisi e inequivocabili. Se state per disalberare in mezzo al Mediterraneo o se c’è un problema durante un’operazione chirurgica non potete perdere tempo a spiegare cosa vi serve.
Così come è pericoloso semplificare la complessità rischiando l’illusione di avere capito tutto senza avere capito molto. I medici hanno fatto enormi passi in avanti rispetto a quando ero bambino io e adesso si fanno carico di spiegare diagnosi e prognosi in modo comprensibile al paziente. Questo è lodevole, purtroppo l’apparente semplicità di una spiegazione ben data sottende invece la complessità di una materia che richiede anni di studio per essere posseduta propriamente; chi cade nell’equivoco tende poi a dialogare direttamente con “Dottor Google” e a fare danni; a sé stessi, quando va bene.
D’altro canto quando i linguaggi diventano troppo specialistici diventano escludenti, creano inevitabilmente delle barriere con l’esterno che in realtà assumono uno specifico obiettivo di escludere i non iniziati per riservare i processi decisionali a chi “ne sa”, lasciando fuori tutto il resto.
Gli informatici non sono gli ultimi in questa ricerca dell’esoterico. Da sempre praticano con gusto e vigore l’elaborazione di linguaggi che perpetuano gli “arcana imperii”. Si rendono conto perfettamente dell’utilità dell’utilizzo del gergo per escludere i non-IT dalle faccende loro. Dopo tutto, se non capisci di cosa stiamo parlando, come fai a dire la tua, anche se sei il PresidentedelCdA/Amministratore Delegato/Megadirettore Clamoroso Duca Conte Dott. Ing. Lup. Man.? Dovrai fidarti, per il meglio o per il peggio.
Ma nel concreto c’è una qualche metrica per capire numericamente quanto si perde in performance e latenza quando si decide di utilizzare una ui basata su un browser (con tutto quello che ci sta in mezzo: html, css e web assembly) piuttosto che renderizzare qualcosa nativamente con QT o similari?
Ecco, appunto.
Sulle definizioni poi si fa un autentico gioco delle tre carte. Lo abbiamo visto ad esempio quando è arrivato il ciclone dei big data: aziende che da vent’anni proponevano sistemi di “business intelligence”, roba tutto sommato scontata, nel corso di una notte si sono rigenerate quali “big data companies”. Lo stesso sta succedendo adesso per la Data Science e la Artificial Intelligence. Per tornare al Manzoni:
Sapete voi quanti siano gl'impedimenti dirimenti? - Che vuol ch'io sappia d'impedimenti? - Error, conditio, votum, cognatio, crimen, Cultus disparitas, vis, ordo, ligamen, honestas, Si sis affinis,... - cominciava don Abbondio, contando sulla punta delle dita. - Si piglia gioco di me? - interruppe il giovine. - Che vuol ch'io faccia del suo latinorum.
Già, il latinorum. Che adesso è diventato English o meglio Itenglish. Insomma, il linguaggio è un problema, e la tecnologia è ormai una babele di lingue, termini, acronimi, framework, mappe e riferimenti, liberamente promossi e pervicacemente sostenuti. Questo non deve succedere per l’Intelligenza Artificiale. La tecnologia digitale è invasiva e pervasiva, e l’AI lo sarà molto presto; dobbiamo evitare di mettere in mano le nostre vite ai tecnocrati. Il linguaggio dell’informatica, in questo momento, esclude i non informatici e impedisce il pieno dispiegarsi delle potenzialità del digitale. Ed è un peccato, perché molti concetti, se spiegati chiaramente e in linguaggio comune, sono perfettamente comprensibili, generano conoscenza e innescano un ciclo virtuoso di apprendimento.
Tutte le volte che lanciamo un progetto informatico dovremmo prevedere strumenti specifici per spiegarlo a chi sarà coinvolto. Non per sommi capi, ma andando il più possibile nel dettaglio e approfittando per seminare la comprensione delle questioni tecniche. Non è per niente impossibile, e va fatto; a volte basta tradurre. E’ il momento dei traduttori e mediatori culturali, astenersi perditempo, la ricerca riveste carattere di urgenza.
Brevi in breve
Aiuto, ci sono robot dappertutto!
Il 2022 sarà l’anno dei robot. Verranno utilizzati in modi sempre nuovi; oltre che nella sanità, nella logistica, in produzione e nell’e-commerce li vedremo sui marciapiedi e per le strade; saranno utilizzati per dare una spallata a problemi importanti quali il riciclaggio dei rifiuti; nasceranno i primi problemi, in particolare quelli dell’interoperabilità, vale a dire che i robot del produttore A parlano un linguaggio diverso e ragionano in modo differente da quelli del produttore B e questo impedisce forme di collaborazione. Di nuovo il linguaggio come barriera.
Robots in 2022: Six robotics predictions from industry-leading humans.
Home sweet home
Se vi piace il Porto o il Madeira avete già un’ottima ragione per andare a vivere in Portogallo. Senza contare il regime fiscale favorevole, il sole, il mare, il Fado e il baccalà. Ma quello che rende irresistibile il pacchetto è la legge recentemente introdotta che proibisce di contattare i lavoratori dopo la fine dell’orario, pena multe severe. Abbiamo perso il controllo dei tempi di lavoro, riconosciamolo. Il fatto che sia possibile scriversi o messaggiarsi a qualunque ora, sabato, domenica, Natale, Pasqua e Capodanno, non vuol dire che farlo sia una buona idea. Il fatto che sia necessaria una legge per impedircelo dovrebbe farci sentire tutti un po’ sciocchi.
Portugal’s ban on after-work emails is a blessing for startups
Geotecnologia
Secondo questa ricerca di Startup Wise Guys il 46,8% delle startup B2B italiane ha sede a Milano! Finanziamento medio di una startup trecentomila euri, una frazione di quello che si raccoglie all’estero. Insomma, forse si salvano quelli che a Natale schifano il pandoro e accettano solo il panetùn, ma in generale questo treno lo stiamo proprio perdendo.
B2B Italian Startup Scene 2021
E ora un po’ di musica
In questo numero abbiamo parlato tanto di linguaggio e di linguaggi. Quello dei numeri è apparentemente semplice e privo di sorprese. Dopo tutto il digitale è fatto di zero e uno, cosa può essere più facile da comprendere e controllare?
Eppure, ci ricorda il Paul Simon di Hearts and Bones, quello che canta cuori e ossa persi nel deserto del New Mexico, tra principesse stellari e il rimpianto di John Lennon, quando i numeri diventano roba seria, allora possono lasciare segni indelebili.
Ho un numero in testa
Ma non so perché è finito lì
Quando i numeri diventano roba seria
Vedi la loro forma dappertuttoDividere, moltiplicare
Sostituire con facilità
Quando i tempi sono misteriosi
E’ facile compiacere i numeri seri
Ma i numeri seri ci parleranno continuamentePerché quando i numeri diventano seri
Lasciano un marchio sulla tua portaE poi, quando tutto è stato detto e ripetuto
E i numeri sono tornati a casa
I quattro si appallottolano nei tre
I tre si trasformano in due
E i due diventanoUno