Sintagma datelor interconectate în contextul intelligence-ului modern

Dacă, pe de o parte, caracterul autonom al tehnologiei situează individul într-un context în care acesta deţine un rol „reţinut, rezervat”, pe de altă parte, acesta poate fi catalogat drept „un nou mediu şi mod de viaţă” .

Alături de teorii conform cărora tehnologiile sunt instrumente sau unelte disponibile scopurilor utilizatorilor, care beneficiază de un caracter neutru, poate fi menţionată„teoria critică a tehnologiei”, ce plasează procesul tehnologic între „resemnare şi utopie” şi analizează noi forme de dezvoltare asociate societăţii moderne, supuse unor noi provocări. În ultimii 3 ani, furnizorii de date (data providers) au facilitat crearea unui spaţiu global de informaţii ce poate fi supus unor „bilioane” de interpretări: web-ul datelor.

Tim Berners Lee a introdus sintagma de date interconectate, definind-o ca „set de bune practici” care facilitează publicarea şi conectarea datelor structurate în mediul virtual. Astfel, link-urile hypertext permit utilizatorilor să parcurgă acest spaţiu prin folosirea browserelor web, în timp ce motoarele de căutare ajută la indexarea documentelor şi analizarea structurii legăturilor dintre acestea, pentru a atribui relevanţă căutărilor realizate de useri.

Date versus documente

Evoluţia mediului virtual din ultima perioadă a permis creionarea unui spaţiu în care, atât documentele, cât şi datele, au devenit interconectate. Adoptarea unui set de bune practici în ceea ce priveşte datele interconectate a condus la ramificarea obţinerii unor conexiuni din domenii precum televiziune, programe radio, droguri, comunităţi online, cărţi etc. Potrivit lui Tim Berners-Lee, este necesară diferenţierea între date şi documente: dacă „documentele pot fi mai mult sau mai puţin citite” şi se pot crea link-uri dinspre şi către acestea, cu datele „putem face tot felul de lucruri cu un computer”. Chiar dacă datele par a fi „rectangulare şi plictisitoare”, ele „pun în mişcare o parte importantă din ceea ce se întâmplă în vieţile noastre”, deoarece acestea urmează un sinuos proces de colectare şi procesare.

Metaforic, acesta este de părere că, pe măsură ce deţinem mai multe ce pot fi conectate, acestea devin cu atât mai valoroase. „nu este numai o rădăcină care alimentează o plantă, dar pentru fiecare dintre acele plante, orice reprezintă ea: o prezentare sau o analiză, cineva care caută şabloane conectează toate acele date”.

Primul pas în publicarea unui material în mediul virtual este atribuirea numelui „http:”, ce poate fi utilizat fie pentru documente, fie pentru ceea ce acestea descriu (persoane, locuri, produse, evenimente). Tim Berners-Lee apreciază că „tot felul de lucruri abstracte deţin, în prezent, nume care încep cu HTTP”.

În al doilea rând, se pot obţine date utile în urma extragerii datelor prin folosirea protocolului „http”, care conţin nu doar noţiuni generale despre ceea ce se află în aria de interes, ci relaţii; într-un mod interesant, „datele sunt relaţii”. De exemplu, în cazul în care realizăm căutări în mediul virtual despre o persoană, putem parcurge un proces „din aproape în aproape”, în încercarea de a identifica cât mai multe informaţii despre aceasta. Astfel, ori de câte ori exprimă o relaţie, atunci, celuilalt lucru cu care este asociat îi este atribuit unul dintre acele nume care încep cu „http”.

Rolul datelor interconectate

Există motoare de căutare generice care utilizează datele interconectate ce permit utilizatorilor să iniţieze cercetarea pronind de la o singură sursă de informaţii şi, ulterior, să navigheze, prin intermediul link-urilor, către surse de date asociate acestora. De asemenea, există browsere care indexează datele şi generează posibilităţi de interogare asupra datelor agregate şi oferă deschidere către dezvoltarea unor noi aplicaţii în domeniu. Spre deosebire de Web 2.0, aplicaţiile datelelor interconectate operează cu un spaţiu de date difuz, fapt ce permite identificarea unor răspunsuri complete pe măsura apariţiei în mediul virtual a unor noi surse.

Conform principiilor datelor interconectate, prin publicarea informaţiilor în mediul virtual, este permisă identificarea şi utilizarea acestora. De asemenea, o mare parte din studiile dedicate analizei link-urilor din mediul virtual au subliniat importanţa îmbunătăţirii performanţelor sistemelelor de recuperare a informaţiilor. În acest sens, informaţiile obţinute din datele interconectate generate de comunităţile virtuale reprezintă una dintre cele mai bogate resurse de informații, încă neexploatate.

Unul dintre principalele obiective ale datelor interconectate este reprezentat de utilizarea mediului virtual ca bază globală unică, fapt ce ar putea oferi atât beneficii, însă, totodată, ar putea genera şi riscuri. O zonă sensibilă ar putea fi încălcarea spaţiului privat în urma integrării datelor din surse distincte. Pentru a preveni acest lucru, este necesar un grad mai mare de conştientizare şi responsabilizare a utilizatorilor cu privire la ce date să ofere şi în ce context. De asemenea, colectarea unor date relevante şi adecvate constituie o reală provocare pentru schiţarea unui tablou de date extrase dintr-un sistem multi-sursă. Apariţia suceptibilităţii în contextul identificării unei informaţii în mediul virtual nu este pe deplin nejustificată. Astfel, se poate aprecia că unul dintre beneficiile-cheie din perspectiva utilizatorului este obţinerea de date din surse eterogene, care nu sunt explicit selectate.

În timp ce browserele hypertext oferă mecanisme de navigare de tipul „forwards”/ „backwards” în cadrul unul spaţiu în care sunt stocate documente, similar, navigarea cu ajutorul unui browser dedicat identificării datelor interconectate ar trebui să faciliteze modul de legtură între entităţi. Acest fapt permite schimbarea centrului de greutate al căutării, în funcţie de interesul userului. Practic, acest tip de browsere ar trebui să ofere mecanisme intuitive şi eficiente atât pentru adăugare, cât şi pentru eliminarea surselor de date într-un context integrat. SIGMA, unul dintre motoarele de căutare ce are la bază serviciul „Sindice” („The Semantic Web Index”), poate fi considerat un bun ghid pentru gestionarea numărului mare de surse ale datelor obţinute. „Sindice” este o platformă care colectează datele din mediul virtual conform standardelor existente, oferind posibilitatea navigării şi interogării informaţiilor care se actualizează, în timp real.

Concluzii

Tehnologia este mai mult decât o sumă de unelte şi instrumente, care restructurează societatea modernă independent de intenţiile utilizatorilor. Astfel, în procesul de alegere a tehnologiilor, reprezentanţii societăţii moderne „devin ceea ce sunt” prin trasarea opţiunilor viitoare, iar actul de alegere este fixat din punct de vedere „tehnologic”. În mod cert, mediul virtual a adus modificări serioase în privinţa modului în care diseminăm cunoaştere, prin înlăturarea unor bariere impuse pentru publicarea şi accesarea documentelor în spaţiul informaţional global.

Autor: Alina Mîlcomete

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile necesare sunt marcate *

*
*