Transformarea Big Data. Produse „live“ pentru beneficiari

Tom Worstall, contributor Forbes, se întreba recent dacă există vreun program software mai periculos ca Stuxnet, arma cibernetică responsabilă pentru sabotarea centralei nucleare de la Natanz (Iran).

Malware-ul, deși nu a fost niciodată asumat oficial, se presupune a fi instrumentul prin care a fost amânată finalizarea programului nuclear iranian, în perioada 2007-2010. Rezultatul direct al acestei îndrăznețe operațiuni instrumentate de servicii de informații, pus într-o perspectivă cantitativă, echivalează cu 1.000 de centrifuge scoase din uz (dintr-un total de 9.000) și scăderea capacității operaționale totale a centralei cu 30%.

Sistemul bancar global se bazează pe Excel

Autorul Forbes opinează că, în ciuda rezultatelor cu care se poate mândri Stuxnet, Microsoft Office Excel este, în mod cert, mai periculos. Pericolul este latent și difuz în majoritatea timpului, dar riscul se poate materializa, pe neașteptate, abrupt și spectaculos. Această idee poate fi ilustrată detaliind un incident din 2012 în care persoana care ocupa poziția de Chief Investment Officer (CIO) în cadrul JP Morgan Chase & Co. a pierdut o sumă foarte mare (se presupune a fi vorba de zeci de miliarde de dolari), bazându-și investiția pe un șir lung și complicat (nu neapărat complex) de formule de calcul specifice unui soft care vine, de regulă, preinstalat pe orice PC și care poate fi folosit și de un școlar pentru a ține evidența notelor primite la desen. În acest caz, totuși, se strecurase o mică eroare într-una dintre formule, greșeală care a generat un lanț de erori în cascadă. Astfel s-a ajuns la conturarea unei evaluări de risc puternic subdimensionate raportat la volatilitatea reală a pieței.

Raportul investigativ realizat de Management Task Force-ul companiei identifică precis eroarea: „după scăderea ratei vechi din rata nouă, formula împărțea rezultatul la suma celor doi coeficienți și nu la media lor, cum ar fi trebuit, înjumătățind coeficientul value-at-risk/ VaR“. CIO a acționat anticipând o creștere a prețului acțiunilor când trebuia să parieze de fapt pe o scădere a lor, astfel că din conturile firmei au dispărut câteva cifre urmate de 9 (sau poate chiar 10) zerouri.

În aprecierea lui James Kwak, acest lucru nu ar trebui să ne surprindă. Modelele matematice complexe pe care se bazează acel segment al lumii de business care depinde de operațiuni matematice – marketing, business development, vânzări, finanțe etc. – funcționează nu în centre de date uriașe, ci pe Excel.

Problema cu numerele

Vina nu o poartă Excel – un program de altfel foarte robust și care, în mâinile potrivite, poate face minuni, ci factorul wetware – analistul raw data – care operează cu dimensiunea software. Orice soft de analiză cantitativă este la fel de inteligent (sau de limitat) ca omul care îi furnizează datele. Cu alte cuvinte, Excel nu știe că greșește și nu te poate avertiza că este o problemă în formulă. Pur și simplu îți oferă, la finalul unui lanț de operațiuni matematice, un număr. Care poate fi fundamental, catastrofic greșit.

Matematica, în special cea complexă, nu este pentru toți oamenii. Doar Neo, protagonistul Matrix, se uita la alt-realitatea înconjurătoare și vedea în timp real codul binar pe baza căruia se fundamenta Visul. Noi, restul, operăm destul de deficitar cu informația numerică brută. Rapid, pe loc, fără foaie și pix ca ajutor, este foarte greu să calculăm suma sau media și mediana unui șir de 20 sau 30 de numere. Într-un set de 100 de numere avem probleme majore în a identifica valorile extreme (outlier-i, aberații statistice), iar estimările cu privire la impactul acestor valori extreme asupra scorurilor finale ce definesc suma sau media șirului devin, la rândul lor, aberante.

Avem, ca specie, pe undeva, o scuză – nu am avut nevoie să realizăm operații matematice complexe ca să ne asigurăm poziția în vârful lanțului trofic și, tot la scară istorică, dar mai recent, nevoile noastre societale de matematică au vizat o dimensiune pur contabilă, de gestionare, de exemplu, a cantității de grâu vândute sau schimbate, în barter, cu sare.

O posibilă soluţie – vizualizarea interactivă

Chiar dacă nu suntem structural pregătiți să operăm nativ cu numere din sfera Big Data, suntem foarte bine echipați să gestionăm informații de natură vizuală. Concret, pornind de la exemplul anterior, sunt foarte dificil de găsit valorile outlier (cele definite statistic ca având o valoare care depășește limitele intervalului definit de medie +/- 2 abateri standard) din tabel, operând strict cu numere.

Aceeaşi informaţie, pusă sub formă de hartă interactivă are o capacitate de absorbţie imediată în mintea beneficiarului:

Consider că procesarea și utilizarea inteligentă, bazată pe reprezentarea grafică, vizuală și tactilă a Big Data reprezintă una din marile șanse ale intelligence-ului din surse deschise. Astfel, prin „democratizarea“ instrumentelor de interogare directă a fondului de cunoaștere pe care îl deținem, putem contribui la misiunea Serviciului Român de Informații de a răspunde rapid și suplu la constanta întrebare a beneficiarilor: „ce înseamnă toate aceste date și informații colectate?“.

Prin astfel de instrumente putem transmite implicit un sentiment de iminență asociat avertizării sau semnalării de materializare de riscuri și amenințări fără să fie nevoie să folosim, precum Al Gore, o platformă hidraulică pentru a arăta cât de periculos de mult a crescut temperatura medie globală în ultimii ani.

Abstract

This article highlights a new avenue for OSINT to remain relevant, in the long term, as a strategic knowledge resource for beneficiaries through collection, processing and analysis of Big Data. The pivot point of the argumentative structure is that quantitative analysis by itself is not enough to significantly impact decision makers and elicit reaction to early warning or early alert signals, but that numbers need powerful visual representations as to contextualize the information and to respond to the constant question that beneficiaries need answered: what does it mean?

Autor: Tudor Raţ

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile necesare sunt marcate *

*
*