Biologie | Chimie | Didactica | Fizica | Geografie | Informatica | |
Istorie | Literatura | Matematica | Psihologie |
Cap.1 Notiuni introductive
1.1 Informatie, date, cunostinte
Notiunea 'informatie' reprezinta o notiune primara, asemanatoare cu notiunea 'materie'.
O definire riguroasa a acestui termen a fost introdusa initial in domeniul tehnic sub forma :
Informatia reprezinta incertitudinea inlaturata prin realizarea unui eveniment dintr-un set de evenimente potential realizabile.
Acest mod de a defini informatia se mai pastreaza astazi doar in domeniul teoriei statistice a comunicatiilor. Semnificatia termenului s-a extins la cunoastere in general, fiind acceptata urmatoarea definitie:
Informatia reprezinta aparitia unui element nou, necunoscut omului sau unui sistem de calcul, privind realitatea inconjuratoare.
Informatia prezinta caracteristici similare celor pe care le au bunurile materiale si anume:
este produsa;
este pastrata;
este prelucrata;
este distribuita;
are un pret de cost;
este perisabila.
Deosebirea profunda intre cele doua categorii apare in procesul de distributie in sensul ca, spre deosebire de bunurile materiale, informatia nu se epuizeaza prin distribuire.
Pretul de cost se datoreaza cheltuielilor legate de obtinerea, memorarea, prelucrarea si difuzarea informatiei.
Perisabilitatea se manifesta prin scaderea in timp a valorii de intrebuintare a unei informatii. Acest fenomen se observa de exemplu foarte bine la informatiile privind tehnologiile utilizate in diverse domenii de activitate.
Pentru a putea inregistra, prelucra si transmite informatie, omul sau sistemul de calcul utilizeaza anumite simboluri pe care le asociaza cu realitatea inconjuratoare. Aceste simboluri nu pot exista fara un suport material.
Forma fizica efectiva a simbolurilor ce reprezinta informatia se numeste data
Datele se caracterizeaza prin :
structura;
valorile admise;
operatiile elementare de transformare;
modul de tratare a erorilor de prelucrare.
Datele obtinute in cadrul diverselor activitati umane constituie un material informational brut care poate fi evaluat, ordonat si prelucrat in diverse scopuri.
In urma procesului de transformare a datelor se obtin informatii ce reprezinta de fapt o interpretare a datelor in raport cu anumite situatii particulare sau cu nivelul de intelegere de catre om la un moment dat.
Numai prin asocierea datelor cu realitatea inconjuratoare are sens afirmatia ' omul sau calculatorul prelucreaza informatie '.
Aceleasi date pot furniza informatii foarte diferite, in functie de interesele si nivelul de pregatire ale celui care face interpretarea lor . De exemplu consumul de zahar pe cap de locuitor poate fi interpretat ca un indicator al nivelului de trai de catre un sociolog sau ca un indicator privind riscul de diabet sau carii dentare de catre un medic.
Prelucrarea datelor urmareste evaluarea, selectarea si ordonarea lor pe baza unui algoritm in scopul obtinerii unor informatii care sa reduca incertitudinea in diverse domenii de activitate si sa conduca la o mai buna intelegere a anumitor fenomene. La rindul lor, informatiile constituie baza rationamentelor si experimentelor imaginate de mintea umana in scopul obtinerii de noi cunostinte.
Din punct de vedere al continutului, informatiile pot fi impartite in doua mari categorii:
a) informatii afective bazate pe senzitivitate si producerea emotiilor (sunt specifice numai omului);
b) informatii cognitive care permit subiectului sa selecteze actiuni perfect determinate ca raspuns la schimbarile in relatiile cu mediul inconjurator.
Cunostintele sunt informatii cognitive generalizate si abstractizate in urma intelegerii unor relatii de tip cauza-efect, stabilite cu ocazia desfasurarii unor fenomene particulare.
Pe baza celor afirmate anterior rezulta ca informatia reprezinta fundamentul cunoasterii.
Schematic procesul de transformare a datelor in cunostinte noi poate fi reprezentat prin diagrama din figura 1.1 .
Din diagrama prezentata in figura 1.1 se observa ca informatiile obtinute sunt utilizate in doua directii si anume:
- utilizare imediata in aplicatiile practice deja implementate;
- fundamentarea unor rationamente si experimente mintale care au ca rezultat final generarea de noi cunostinte.
Fig. 1. 1 |
Procesul este ciclic in sensul ca si cunostintele noi obtinute pot influenta la rindul lor activitatile de culegere si de prelucrare a datelor precum si aplicatiile, in sensul cresterii performantelor si acumularea de noi informatii si cunostinte.
Intre informatiile dintr-un domeniu si cunostintele din acel domeniu exista o legatura dialectica in sensul ca in general cunostinte avansate permit obtinerea unor informatii mai ample si precise care la rindul lor prin procesul de rationare si experimentare conduc la obtinerea de noi cunostinte.
Gradul de utilizare a informatiei si eficienta utilizarii acesteia in diverse activitati umane sunt determinate de indici de calitate specifici: precizia, oportunitatea si completitudinea.
Precizia reprezinta raportul dintre cantitatea de informatie corecta si intregul volum de informatie produsa intr-o anumita perioada de timp.
In general, pentru a creste valoarea acestui indice este necesar sa fie prelucrata o cantitate cit mai mare de date. Dar culegerea si prelucrarea unui volum mai mare de date inseamna cheltuieli suplimentare si intirzieri in obtinerea rezultatelor ceea ce in multe situatii nu poate fi acceptat.
Oportunitatea (actualitatea) exprima faptul ca o anumita informatie este utila intr-un anumit moment legat de desfasurarea in timp a unor activitati, evenimente, fenomene.
Obtinerea unor informatii cu o anumita intirziere scade considerabil sau chiar anuleaza valoarea acestora. De exemplu obtinerea informatiilor privind o anumita tehnologie imediat ce aceasta a fost pusa la punct poate oferi numeroase avantaje, in timp ce obtinerea acelorasi informatii dupa ce majoritatea producatorilor au aplicat-o in productie scade considerabil beneficiul obtinut, mai ales daca intre timp au aparut tehnologii cu performante superioare.
Fig. 1. 2 |
Schematic fenomenul de perisabilitate poate fi reprezentat ca in figura 1.2.
Alura celor doua curbe care reprezinta evolutia in timp a pretului de cost, respectiv a valorii de piata a unei informatii, are urmatoarele explicatii:
pretul de cost are o tendinta general descrescatoare; viteza de descrestere este cu atit mai mare cu cit algoritmul de prelucrare a datelor este mai simplu si cu cit creste numarul de centre de prelucrare si de distributie;
initial este posibil ca valoarea atribuita unei informatii sa fie sub pretul de cost deoarece nu se cunoaste inca unde poate folosita informatia ( de exemplu anumite informatii stiintifice si tehnice a caror aplicare in practica nu este posibila sau nu este inteleasa decit cu o anumita intirziere);
intelegerea posibilitatilor de utilizare a unei informatii conduce la o crestere a valorii sale;
scaderea pretului de cost, cresterea numarului surselor de informare, scaderea beneficiilor in urma utilizarii si aparitia unor informatii noi conduc inevitabil la scaderea valorii informatiei pina la un moment in care valoarea scade sub pretul de cost.
Este evident ca in multe situatii pot sa apara contradictii intre precizie si oportunitate. Aceasta contradictie se poate rezolva optim in functie de natura si specificul activitatii de care sunt legate informatiile.
Completitudinea reprezinta necesitatea de a dispune de cit mai multe (ideal toate) informatiile referitoare la un anumit domeniu de interes.
Avind in vedere nivelul de cunostinte din diverse sectoare de activitate, completitudinea este mai mult un deziderat decat o realitate.
Intre informatiile si cunostntele dintr-un anumit domeniu exista o legatura profunda. Cunostinte avansate permit obtinerea unor informatii mai bogate. La rindul lor, informatiile nou dobindite, prin procesele de rationare si experimentare, conduc la obtinerea de noi cunostinte.
Obtinerea informatiilor cu calitatile mentionate este conditionata atit de datele primare cit si de mijloacele de prelucrare disponibile. Daca datele folosite in procesul de obtinere a informatiilor sunt inexate, incomplete sau perimate, valoarea informatiilor care rezulta este scazuta iar efectul asupra cunostintelor poate fi chiar negativ (pot genera concluzii gresite ). Pentru aceasta situatie, in domeniul utilizarii calculatoarelor este cunoscut principiul GIGO (Garbage In, Garbage Out adica Gunoi Introduci, Gunoi Obtii). Nu exista practic metode pentru a exclude toate datele eronate, totusi pot fi puse la punct pentru fiecare caz in parte proceduri speciale de verificare si validare care permit excluderea unei parti importante a erorilor. Efortul si costurile suplimentare legate de validarea datelor se justifica prin cresterea preciziei informatiilor obtinute si prin reducerea cheltuielilor legate de eliminarea consecintelor negative ale utilizarii unor date eronate. Exista domenii in care orice eroare poate avea consecinte economice, sociale si morale inacceptabile. De exemplu, nu se poate accepta ca ordinea de clasificare a concurentilor sa fie afectata de introducerea eronata a punctajului la o disciplina de concurs.
1.2 Ciclul de prelucrare al datelor
1.2.1 Prezentare generala
Utilizarea eficienta a calculatorului in prelucrarea datelor presupune rezolvarea tuturor etapelor operationale prin care trec datele din momentul generarii lor si pina la obtinerea rezultatelor finale. Aceste etape, independente de domeniul de activitate sau natura datelor, formeaza ciclul de prelucrare a datelor sau ciclul de viata al datelor.
Principalele etape din ciclul de prelucrare a datelor sunt:
culegerea datelor;
inregistrarea datelor in calculator;
verificarea si validarea datelor;
pastrarea datelor;
prelucrarea propriuzisa a datelor;
distribuirea rezultatelor.
Aceste etape sunt profund legate intre ele si calitatea rezolvarii unei etape influenteaza direct calitatea rezolvarii celorlalte etape. De fapt punerea in evidenta a acestor etape are mai mult un caracter metodologic. In practica este relatv dificil sa se separe unele etape de altele. De exemplu verificarea si validarea datelor este in multe situatii legata de culegerea datelor si introducerea lor pe calculator iar pastrarea datelor este specifica tuturor etapelor ciclului de prelucrare, avind forme specifice pentru fiecare etapa.
In continuare vor fi analizate aceste etape punindu-se in evidenta obiectivele si caracteristicile fiecarei etape si modul cum influenteaza celelalte etape ale ciclului de prelucrare.
1.2.2 Culegerea datelor
Datele primare sunt culese direct de la sursele primare care le genereaza. Culegerea poate fi realizata manual sau automat.
Culegerea manuala presupune inregistrarea datelor pe diverse suporturi fizice numite documente primare .
Calitatea documentelor primare influenteaza direct si puternic randamentul prelucrarii si utilizarii informatiei continute. Pe de o parte continutul lor trebuie sa reflecte in mod cit mai natural realitatea pe care o reprezinta iar pe de alta parte trebuie sa poata fi cit mai repede preluate si prelucrate de catre sistemul de calcul.
In cadrul informatiilor cu un grad inalt de organizare, documentele primare sunt in general formulare tipizate ( fise, tabele, chitante, diagrame etc. ).
In cazul informatiei slab structurate, problemele de culegere a datelor sunt mult mai dificile avind in vedere diversitatea suportului fizic si modul de realizare (documente olografe, carti, reviste, fotografii, harti, filme, inregistrari audio sau video, etc.), dificultatile de compatibilizare, volumul foarte mare de informatie, dificultatile de codificare etc.
Culegerea automata presupune existenta unor traductoare care pe baza stimulilor externi genereaza date astfel codificate incit sa poata fi receptionate si prelucrate direct de catre sistemele numerice.
Culegerea automata a datelor este specifica activitatilor de conducere cu calculatorul a unor procese tehnologice. In acest caz, pentru a permite culegerea datelor in timp real, se utilizeaza sisteme speciale de achizitie a datelor. Dezvoltarea retelelor de calculatoare permite achizitia automata de date de catre un anumit sistem de calcul de la alte sisteme aflate in nodurile retelei.
O situatie cu totul aparte a aparut in ultimul timp datorita cresterii numarului documentelor primare redactate cu calculatorul deoarece in foarte multe situatii datele continute de aceste documente nu pot fi transferate direct intre sistemele de calcul si necesita reintroducerea lor manuala. De asemenea exista numeroase probleme la transferul automat de date intre diverse sisteme de calcul, mai ales cind datele au fost generate cu alte pachete de programe decit cele folosite la preluarea lor. Pentru rezolvarea acestor probleme au fost puse la punct programe speciale de compatibilizare a formatelor de date , care permit transferul de date intre programe ce utilizeaza protocoale diferite de reprezentare a datelor.
1.2.3 Inregistrarea datelor in calculator
Transcrierea datelor intr-o forma accesibila sistemului informatic ( SI ) se poate realiza direct sau pe suport intermediar.
In cazul inregistrarii directe, datele culese sunt introduse direct in memoria calculatorului cu ajutorul unor traductoare, de la tastatura unei console sau prin sistemul de teletransmisie a datelor de la un sistem de calcul la altul. Este necesar sa se asigure codificarea si formatul corespunzatoare pachetului de programe ce va realiza prelucrarea propriuzisa.
Introducerea datelor prin tastatura consolei impune dezvoltarea unor mecanisme puternice de protectie si validare a datelor si crearea unor posibilitati de corectare imediata a erorilor de operare. La ora actuala operatorii au la dispozitie pe display machete speciale pentru introducerea datelor. Redactarea machetelor de introducere a datelor de la consola este relativ mare consumatoare de timp si din aceasta cauza au fost create mijloace software foarte puternice pentru generarea lor chiar si de catre cei fara cunostinte avansate in domeniul programarii.
O macheta de calitate trebuie sa tina cont nu numai de continutul informational ci si de aspectul artistic si de aspecte de ergonomie in sensul asigurarii unei solicitari minime din punct de vedere fizic si psihic a operatorului uman.
Operatorul trebuie sa fie permanent ghidat prin semnale video si audio si prin mesaje asupra tuturor operatiilor pe care trebuie sa le efectueze si a rezultatelor actiunilor sale.
Aspecte ale codificarii datelor
Informatia nu poate fi conceputa in afara unui proces de schimb intre doi parteneri- unul care o genereaza (sursa) si altul care o receptioneaza (receptor). Schimbul de informatii ridica probleme specifice ce decurg din forma de exprimare adica din expresia fizica si formala a continutului. Receptorul nu poate retine si interpreta informatia primita decat atunci cand are acces la suportul fizic si cunoaste codul folosit de emitator.
Exemplu Desi traim intr-o "mare" de unde electromagnetice, informatia pe care acestea o transporta nu poate fi obtinuta decat de cei de dispun de un receptor radio sau TV si pot decodifica semnalele receptionate. Suplimentar, in cazul mesajelor verbale este necesara cunoasterea limbii in care a fost fomulat mesajul.
Informatia si codificarea sunt entitati inseparabile. Informatia nu poate exista fara un suport formal de exprimare, tot asa cum o codificare ce nu serveste inregistrarii si transmiterii informatiei este un lucru lipsit de sens.
Parcurgerea ciclului de prelucrare automata a datelor implica existenta unor tipuri diferite de codificare a datelor.
Codificarea externa a informatiei. Apare atat in procesul de culegere a datelor atunci cand fiecarei entitati informationale i se pune in corespondenta un simbol format din litere, cifre si semne speciale, cat si la extragerea rezultatelor.
Problema codificarii datelor de intrare este deosebit de importanta pe de o parte pentru cresterea randamentului prelucrarilor ulterioare iar pe de alta parte pentru o mai simpla manipulare a acestora de catre om. Daca din punctul de vedere al omului se prefera asocierea unor simboluri cat mai apropiate de limbajul natural, din punctul de vedere al calculatorului se prefera o codificare "optima" adica cu un numar minim de simboluri, alese in asa fel incat sa permita prelucrarea cu un numar minim de operatii. Uneori astfel de codificari exista deja in sectorul de activitate din care provin datele, fiind necesare in activitatea curenta.
Exemplu Intr-o colectie de date privind studentii unei facultati se poate folosi in codificarea informatiei nu numele si prenumele studentilor ci numarul matricol, avand in vedere ca fiecarui student ii corespunde un numar matricol unic. O astfel de codificare are avantajul ca elimina orice ambiguitate in identificarea studentilor dar implica revenirea la forma naturala de reprezentare umana pentru a putea fi folosita de catre om.
La ora actuala, avand in vedere posibilitatile oferite de sistemele de calcul moderne, se prefera introducerea datelor cu ajutorul unor machete special concepute sau prin utilizarea unor limbaje cat mai apropiate de cele naturale. De asemenea, la extragere se prefera formate de reprezentare cat mai sugestive, incluzand elemente multimedia usor de interpretat, fiind eliminate pe cat posibil codificarile care faceau posibila citirea documentelor doar de catre specialistii cu experienta in domeniu.
Codificarea interna a informatiei Este specifica procesului de prelucrare a datelor deoarece calculatorul lucreaza numai in reprezentare binara. Codificarea se poate face conform unor standarde de larga circulatie (ASCII, binar, binar-zecimal etc) sau pe baza unor conventii locale care sa asigure performante cat mai bune pentru un caz concret. De calitatea codificarii interne depind timpul de prelucrare, portabilitatea programelor, posibilitatea utilizarii datelor de catre mai multe categorii de utilizatori.
Codificarea redundanta Este caracteristica proceselor de transmisie si pastrare a informatiei pe diverse suporturi interne sau externe.
In principiu codificarea redundanta presupune ca pe linga simbolurile utile (numite si simboluri informationale) prin care se codifica informatia propriuzisa, sa fie introduse si un numar de simboluri suplimentare (numite si simboluri de control), aflate in anumite relatii prestabilite cu simbolurile informationale. Detectarea la receptie a incalcarii uneia dintre aceste relatii permite detectarea si uneori chiar corectarea erorilor aparute. Cel mai cunoscut exemplu este bitul de control la paritate, astfel ales incat sa asigure la emisie acelasi tip de paritate pentru toate grupele de biti ce compun un mesaj. Un caz particular al codificarii interne a datelor il reprezinta compresia datelor utilizata pe scara larga in special in operatiile de arhivare si la reprezentarea imaginilor si sunetelor datorita cantitatii mari de informatie implicata de acestea. Principalul obiectiv al compresiei datelor il reprezinta reducerea volumului de memorie ocupata de date. Utilizarea compresiei datelor are pe linga avantajele certe legate de volumul mult mai mic de memorie ocupata si unele dezavantaje cum ar fi cresterea timpului global de lucru, scaderea portabilitatii programelor aplicative, scaderea fiabilitatii, cresterea complexitatii prelucrarilor etc. In ciuda acestor dezavantaje, colectiile de date multimedia nu pot fi concepute fara utilizarea compresiei datelor.
Un aspect special al codificarii il constituie criptarea informatiei, adica reprezentarea acesteia sub o forma speciala astfel incat sa nu poata fi recunoscuta decat de catre cei ce cunosc regula de criptare. Criptarea poate fi facuta atat la nivelul codificarii externe (de exemplu cand operatorul nu trebuie sa cunoasca semnificatia datelor pe care le manipuleaza) cat si la nivelul codificarii interne pentru a preveni furturile de informatie. Criptarea trebuie folosita cu grija si numai acolo unde este cu adevarat necesara, deoarece complica prelucrarile, creste timpul de lucru si poate conduce la pierderi irecuperabile de date in cazul unor accidente.
Verificarea si validarea datelor
Verificarea si validarea datelor reprezinta operatii deosebit de importante deoarece introducerea unor date eronate poate compromite complet rezultatele utilizarii datelor cu consicente economice sau sociale uneori inacceptabile.
Verificarea si validarea datelor trebuie realizate conform unor protocoale bine puse la punct, care sa specifice in clar cine raspunde pentru corectitudinea fiecarei categorii de date introduse. Verificarea si validarea pot fi realizate in mai multe momente de timp bine definite, cum ar fi:
verificarea la preluarea datelor in documentele primare cand se va testa claritatea inregistrarilor, daca documentele pot fi citite, daca datele introduse sunt plauzibile si respecta standardele si normele in vigoare, daca au fost completate toate datele solicitate etc;
verificare in timpul introducerii manuale a datelor pentru a semnala depasirea anumitor valori limita, nerespectarea unor formate de reprezentare, utilizarea unor simboluri neadmise etc;
verificarea dupa introducerea manuala a datelor in calculator pentru eliminarea erorilor umane ce nu au putut fi detectate cu calculatorul in faza de introducere; este probabil cea mai importanta verificare, deoarece erorile nesemnalate in aceasta faza pot fi cu greu depistate in fazele urmatoare mai ales daca nu provoaca erori in executia unor programe aplicative sau daca nu conduc la rezultate evident aberante;
verificarea in timpul prelucrarilor pentru a depista depasirea unor valori limita, existenta unor necorelari intre date; este importanta mai ales in faza de testare a programelor aplicative cand se recomanda utilizarea unor date special selectate care sa permita stabilirea corectitudinii rezultatelor obtinute in situatii cat mai diverse (alegerea datelor de test este o problema dificila deoarece implica atat o cunoastere profunda a situatiilor reale ce pot sa apara cat si a programelor testate si a sistemelor pe care se desfasoara testarea);
verificarea finala a documentelor redactate in scopul validarii corectitudinii formatelor afisate, a calitatii imprimarii, a aspectului si completitudinii continutului inainte de autentificarea prin semnatura de catre persoanele autorizate.
Evitarea unor etape de verificare si validare pe motiv ca acestea scad viteza globala de rezolvare a aplicatiilor poate avea consecinte finale deosebit de grave care compromit increderea in utilizarea tehnicii de calcul si implica uneori chiar raspunderea administrativa sau penala.
Pastrarea datelor
La ora actuala pentru pastrarea datelor se utilizeaza in special discuri magnetice care asigura un raport foarte bun intre capacitatea de memorare si timpul de acces la date. In acelasii timp se constata o continua scadere a pretului pe unitatea de informatie memorata. Datorita acestor calitati au putut fi dezvoltate colectii de date de ordinul terraoctetilor si se prevede pentru un viitor relativ apropiat asigurarea unor capacitati de ordinul petaoctetilor.
Cresterea continua a cantitatii de informatie memorata a ridicat anumite probleme cum ar fi:
cresterea timpului de cautare a informatiilor utile;
cresterea complexitatii sistemelor de gestiune a fisierelor;
cresterea pericolului de pierdere a informatiei;
cresterea consecintelor negative ale unor pierderi accidentale sau distrugeri premeditate a informatiei;
necesitatea introducerii unor metode sofisticate de protectie si securitate a datelor.
Aceste probleme au impus dezvoltarea unor tehnici speciale pentru gestiunea memoriei secundare. In cazul unor colectii de date din domeniul audio si video, datorita cantitatii foarte mari de informatie a fost necesara dezvoltarea unor tehnici specifice de compresie si decompresie a datelor care sa asigure pe de o parte ocuparea unui volum cat mai mic de memorie iar pe de alta parte sa permita obtinerea in timp util a informatiilor dorite.
Necesitatea asigurarii unei viteze de lucru cat mai mari a impus introducerea unor noi metode de organizare a informatiei si a unor tehnici de cautare rapida a informatiei.
Utilizarea de catre un numar tot mai mare de utilizatori a aceleeasi colectii de date a impus intoducerea unei discipline riguroase pentru sincronizarea accesului la date, actualizarea datelor si interzicerea acceselor frauduloase.
O problema foarte importanta o reprezinta crearea cópiilor de siguranta si a arhivelor de date, dificil de realizat si intretinut in cazul unor colectii de date foarte mari. Arhivarea datelor poate fi realizata pe discuri flexibile pentru baze de date personale, pe benzi magnetice sau pe discuri magnetice in cazul unor baze de date foarte mari.
In cazul in care datele pastrate sunt de tipul "citeste numai" si nu se impun restrictii severe privind viteza de lucru, datele pot fi memorate si pe alte suporturi cum ar fi discurile CDROM cu o capacitate mare de stocare a informatiei si fiabilitate sporita.
1.2.7 Prelucrarea datelor
Prelucrarea datelor inseamna transformarea datelor pe baza unui anumit algoritm in scopul extragerii de informatie sau cunostinte. Elementul fundamental il reprezinta algoritmul, care poate fi un algoritm foarte simplu (cautarea dupa un criteriu oarecare) sau sofisticat (analiza datelor primare si extragerea de cunostinte prin depistarea unor sabloane). Metodele de prelucrare difera foarte mult in functie de natura datelor (cautarea dupa un cuvant cheie este mult mai simpla decat cautarea dupa culoare a unei regiuni intr-o imagine). Software-ul modern pune la dispozitie o gama larga de functii si proceduri pentru prelucrarea datelor totusi in continuare realizarea programelor aplicative ramane o sarcina dificila deoarece se constata o crestere continua a complexitatii aplicatiilor solicitate de beneficiari.
Prelucrarea datelor dintr-o colectie de date poate fi realizata prin lansarea de catre beneficiar a unei cereri simple prin care sa solicite cautarea informatiilor pe baza unor criterii prestabilite sau adhoc ori prin lansarea unor programe de prelucrare sofisticate. O problema importanta o reprezinta protectia informatiilor fata de accesul neautorizat realizat accidental sau in scopuri frauduloase. Este necesar sa fie respinse cererile formulate de persoane care nu trebuie sa aiba acces la informatie sau pot provoca prin cererile formulate distrugerea totala sau partiala a datelor. O situatie speciala apare in retelele de calculatoare cand prin lansarea cu rea credinta a unor cereri repetate de prelucrare a datelor dintr-o colectie de date se poate bloca accesul altor utilizatori la datele respective. Evitarea unor astfel de situatii este foarte dificila si in general proiectantii de sisteme pentru gestiunea datelor isi propun nu eliminarea propriuzisa a fraudelor ci descurajarea lor prin cresterea pretului de cost si timpului necesar punerii lor in aplicare precum si limitarea efectelor negative.
Distribuirea rezultatelor
Modul in care rezultatul prelucrarii datelor ajunge la beneficiar este deosebit de important deoarece de aceasta depinde in mare masura nivelul de intelegere al informatiilor furnizate. Metodele de distribuire a rezultatelor au evoluat puternic de-a lungul timpului in functie de evolutia tehnologiei informatice. Principalele forme de distribuire a informatiilor obtinute prin prelucrarea colectiilor de date sunt:
a) Documente afisate pe display- reprezinta probabil cel mai utilizat mijloc de prezentare a informatiilor in special datorita dezvoltarii retelor de calculatoare. Paginile de afisare a rezultatelor pot oferi facilitati deosebite cum ar fi:
o gama foarte larga de fonturi si culori pentru afisarea textelor;
imagini;
grafice, tabele,diagrame;
animatie;
video;
avertizari sonore;
posibilitati de navigare rapida prin continutul documentelor;
posibilitati de conectare rapida la alte documente.
b) Rapoarte tiparite - asemanatoare documentelor utilizate de om. La ora actuala aceste documente au ajuns la un grad inalt de sofisticare putand sa contina texte si elemente grafice, alb-negru sau color. Un accent deosebit se pune pe elementele de grafica (tabele, diagrame, grafice) care pot reprezenta intr-o forma sintetica foarte sugestiva informatii importante.
c) Fisiere - pentru transferul intre diversi beneficiari, pentru arhivare sau tiparire ulterioara.
Extinderea utilizarii retelelor de calculatoare si in special a Internetului a influentat foarte mult modul de transfer si prezentare a informatiei mai ales prin cresterea vitezei de transmisie a informatiilor intre beneficiari ceea ce a permis dezvoltarea unor aplicatii de mare complexitate cum ar fi comertul electronic, tranzactiile bancare etc.
Prezentarea rezultatelor prelucrarilor trebuie sa tina cont de urmatoarele cerinte:
Cerinte informationale - informatiile oferite trebuie sa fie corecte, actuale, complete, intr-o succesiune logica. Pe cat posibil informatiile trebuie sa corespunda necesitatilor beneficiarului, fiind evitate informatii colaterale specifice unor cereri mult mai generale.
Exemplu Daca beneficiarul doreste lista studentilor unei anumite formatii de lucru, care au obtinut note de promovare la toate materiile dintr-o anumita sesiune, este suparator sa primeasca o lista cu notele tuturor studentilor, la toate materiile, chiar daca lista respectiva contine informatiile solicitate de el.
Cerinte ergonomice - legate in special de afisarea pe display. Este necesar ca formatul documentelor afisate sa puna in evidenta cat mai bine diversele informatii, sa poata fi usor citite si interpretate si sa solicite cat mai putin fizic si psihic operatorul uman. Pentru aceasta este necesar sa fie respectate cateva reguli elementare:
Se vor evita fondurile cu culori stridente (rosu, galben, magenta) mai ales daca documentul va fi afisat un timp mai indelungat. Se prefera culori calme (albastru, verde, bej, gri).
Textul va fi scris cu culori ce se afla in contrast cat mai puternic cu fondul pentru o citire usoara. Pentru a pune in evidenta anumite informatii se pot folosi fonturi diferite sau culori diferite. Pentru a scoate in evidenta anumite informatii se folosesc caractere italice, sublinierea sau caractere ingrosate.
Se vor utiliza pe cat posibil fonturile cu care beneficiarul este obisnuit din activitatea sa curenta si formate ale documentelor cat mai apropiate de formularele tipizate utilizate in domeniul respectiv.
Se evita abuzul in folosirea caracterelor italice sau a unor fonturi sofisticate deoarece acestea apar uneori deformate pe ecran si sunt greu de citit mai ales daca se utilizeza dimensiuni mici ale caracterelor.
Folosirea corecta a identarilor simplifica cautarea informatiilor dorite in special in cazul unor informatii puternic ierarhizate.
Dimensiunea fondurilor si spatierea intre randuri vor fi astfel alese incat sa asigure pe de o parte o citire cat mai usoara iar pe de alta parte sa permita introducerea unei cantitati cat mai mari de informatie pe pagina.
Se va asigura posibilitatea revenirii rapide la paginile deja parcurse fara a fi nevoie de reformularea cererii.
Cerinte estetice - uneori neglijate pe motiv ca nu sunt necesare din punct de vedere informational si cresc nejustificat timpul de implementare si pretul de cost al aplicatiilor. In realitate un document placut la vedere, echilibrat din punct de vedere al dimensiunilor si culorilor, cu un fundal adecuat subiectului, este mult mai putin obositor si are un impact favorabil asupra vitezei de citire si intelegere. Folosirea unor imagini de calitate specifice subiectului, reprezentarea grafica a unor date are ca efect asimilarea rapida a informatiilor. Evident, abuzul de elemente artistice poate avea un efect negativ prin cresterea volumului de memorie si a timpului de transmisie si citire, mai ales pe sistemele de calcul de calitate mai slaba.
1.3 Sisteme informationale
1.3.1 Prezentare generala
Vom numi intreprindere orice reuniune a unor resurse umane, tehnice si financiare necesare desfasurarii unei anumite activitati cu un scop bine precizat.
Vom numi afacere orice activitate umana desfasurata in scopul rezolvarii unei probleme bine definite.
Sistemul informational reprezinta totalitatea mijloacelor umane si tehnice care contribuie la realizarea ciclului de viata al datelor necesare desfasurarii activitatii unei intreprinderi.
Cu alte cuvinte putem spune ca sistemul informational asigura toate mijloacele prin care datele sunt preluate din mediul informational brut, transformate in colectii de date organizate dupa criterii bine precizate, si prelucrate in scopul transformarii lor in informatii, cunostinte, decizii si actiuni specifice activitatii intreprinderii.
Crearea colectiilor de date nu reprezinta un scop in sine ci serveste la acoperirea unor necesitati informationale ale unei intreprinderi.
Sistemul informatic reprezinta totalitatea mijloacelor de prelucrare automata a datelor unei intreprinderi cu ajutorul tehnicii de calcul.
Performantele unui sistem informatic se bazeaza in principal pe urmatoarele trei elemente:
o colectie de date corect proiectata si implementata;
proceduri de administrare a datelor si informatiilor;
programe aplicative de transformare a datelor.
Observatie:
Deoarece la ora actuala este greu de conceput dezvoltarea unui sistem informational fara utilizarea sistemelor de calcul, notiunile sistem informational si sistem informatic se utilizeaza frecvent ca sinonime fara a crea confuzii.
Sistemul informational al unei intreprinderi nu este un produs natural ci este produsul unei activitati specifice de proiectare si implementare.
Procesul prin care se determina necesitatile informationale ale unei intreprinderi si limitele acestora se numeste analiza de sistem (systems analysis).
Procesul prin care se implementeaza sistemul informational al unei intreprinderi se numeste dezvoltare de sistem (systems development).
Deoarece o intreprindere nu este un sistem static ci unul dinamic ce evolueaza intr-un mediu in continua schimbare, si sistemul sau informational va trebui sa se dezvolte continuu pentru a face fata noilor cerinte impuse. Ca parte componenta fundamentala a oricarui sistem informational, colectia de date aferenta va trebui in permanent dezvoltata si modificata pentru a face fata cerintelor impuse de modificarea continua a conditiilor de utilizare.
Ciclul de viata al dezvoltarii sistemelor informationale
Procesele permanente de creare, mentenanta, dezvoltare si inlocuire a unui sistem informational formeaza ciclul de viata al dezvoltarii sistemelor informationale (Systems Developement Life Cycle - SDLC).
Principalele etape ale ciclului de viata al dezvoltarii sistemelor informationale sunt reprezentate in diagrama din figura 1.3.
Fig. .3
In faza de planificare se obtine o imagine generala a sistemului informatic al unei intreprinderi. Chiar daca nu a fost creat in mod planificat, in orice intreprindere trebuie sa existe un sistem informational datorat fluxului de date intre diversele sectoare de activitate. De aceea prima intrebare la care trebuie sa se raspunda este:
Sistemul informational actual poate fi utilizat in continuare?
Evident, daca sistemul raspunde bine cerintelor formulate de beneficiar, nu are sens sa se modifice sau inlocuiasca sistemul deoarece orice modificare implica cheltuieli materiale si riscul unor perturbari in functionare. Daca insa dupa o prima evaluare se constata ca cel putin unele aspecte ale functionarii sistemului actual nu satisfac cerintele beneficiarului, se va raspunde la urmatoarea intrebare:
Sistemul informational actual trebuie doar modificat sau este necesara inlocuirea sa?
Dupa ce specialistii au stabilit cateva alternative pentru aducerea la zi sau inlocuirea vechiului sistem, se poate trece la un studiu de fezabilitate care sa decida daca cerintele impuse sistemului pot fi implementate cu mijloacele tehnice si financiare disponibile.
Analiza aspectelor tehnice ale implementarii are in vedere in primul rand:
natura sistemelor de calcul (PC-servere sau statii de lucru, mini sau mainframe);
natura terminalelor;
necesitatea dezvoltarii unor retele locale, metropolitane sau nationale;
natura aplicatiilor (gestiune, financiar/contabile, conducerea in timp real etc);
necesarul de software.
Analiza aspectelor financiare trebuie sa rezolve urmatoarele probleme:
evaluarea pretului de cost al diverselor variante de implementare;
evaluarea beneficiilor intreprinderii pentru fiecare varianta avuta in vedere;
posibilitatile de utilizare ale vechii structuri si dotari;
posibilitatea de etapizare a dezvoltarii noului sistem;
evaluarea resurselor materiale si umane ale intreprinderii pe durata dezvoltarii sistemului.
Faza de analiza reia problemele puse in evidenta in faza de planificare si le studiaza in detaliu. Analiza consta in primul rand dintr-o succesiune de interviuri in care echipa de analisti solicita de la beneficiar date amanuntite privind cerintele impuse noului sistem informatic. Tot in aceasta faza se realizeaza testarea si evaluarea vechiului sistem informational pentru a intelege mai bine problemele pe care le ridica si pentru a evita aparitia acelorasi anomalii si in noul sistem. Colaborarea stransa intre analist si beneficiar este vitala pentru obtinerea unor rezultate corespunzatoare. Pe baza informatiilor din etapele precedente se poate trece la realizarea unui model conceptual al sistemului informational care va cuprinde informatii privind fluxul de date in intreprindere, procesele de transformare a datelor, datele de intrare si datele de iesre specifice fiecarui proces de transformare, procedurile de verificare si validare a datelor etc. Acest model nu contine in general informatii concrete cum ar fi de exemplu tipul de sistem de operare, firma care-l livreaza, pretul de cost etc. ci doar specificatiile impuse sistemului de operare necesar realizarii obiectivelor propuse si eventual o lista cu sisteme ce satisfac aceste cerinte.
In faza de proiectare detaliata a saistemului se completeaza toate detaliile privind:
numarul si tipul sistemelor de calcul necesare pentru fiecare sector;
tipul de retea;
tipul perifericelor si firmele producatoare;
lista aplicatiilor avute in vedere;
continutul si aspectul meniurilor, formelor si rapoartelor pentru fiecare aplicatie;
continutul si modul de organizare al colectiilor de date;
tipul si structura formularelor pentru captarea datelor primare;
algoritmii de prelucrare a datelor;
procedurile de verificare si validare si responsabilitatile in realizarea acestor operatii;
etapele de dezvoltare ale sistemului, cu termene si responsabilitati precise;
strategiile de testare a produselor software;
necesarul de personal, planul de scolarizare al angajatilor si planul de acomodare cu noul sistem.
Toate acestea vor face obiectul unor documente oficiale semnate atat de proiectant cat si de beneficiar.
Pe durata fazei de implementare se realizeaza urmatoarele operatii:
se achizitioneaza echipamentele si produsele program necesare;
se instaleaza echipamentele si software-ul de baza necesare;
se multiplica noile documente primare;
se implementeaza colectiile de date;
se dezvolta programele de aplicatii;
se testeaza fiecare componenta a sistemului informatic;
se testeaza functionarea in conditii reale a intregului sistem;
se angajeaza, daca este cazul, personal nou si se trece la scolarizarea in vederea utilizarii noului sistem (aceasta etapa este delicata din punct de vedere al consecintelor sociale deoarece poate implica disponibilizarea unei parti din angajatii ce deserveau vechiul sistem informatic si care nu mai sunt utili sau nu se pot adapta la noul sistem);
se antreneaza intreg personalul in vederea utilizarii noului sistem;
se elimina anomaliile semnalate pe durata testelor si a folosirii in conditii reale si se adapteaza sistemul la cerintele formulate de operatori.
La sfarsitul acestei faze sistemul trebuie sa fie pe deplin functional in toate compartimentele iar personalul pregatit pentru utilizare.
Observatie Din motive financiare sau pentru a accelera darea in folosinta, implementarea poate fi realizata si in etape, pe sectoare sau aplicatii, in functie de hotararea luata pe baza studiului de fezabilitate. Etapizarea darii in folosinta trebuie sa tina cont de necesitatile reale ale intreprinderii, fiind dezvoltate in primul rand aplicatiile prioritare, cu impact maxim asupra cresterii randamentului activitatii intreprinderii.
Faza de mentenanta presupune trei operatii distincte:
evaluarea continua a performantelor sistemului;
eliminarea unor anomalii de functionare ce nu au putut fi puse in evidenta in fazele anterioare (mentenanta corectiva) si adaptarea la modificarile aparute in legislatie sau in desfasurarea activitatii intreprinderii (mentenanta adaptiva);
dezvoltarea sistemului prin introducerea de noi aplicatii, dezvoltarea unora dintre aplicatiile deja implementate, optimizarea fluxului de date etc (mentenanta perfectiva).
Practica a demonstrat ca, imediat dupa darea in folosinta a unui sistem informational, beneficiarul incepe sa solicite modificari ale acestuia. Aceasta situatie apare in mod obiectiv in special datorita urmatoarelor aspecte:
in fazele de evaluare/proiectare nu pot fi luate in considerare toate scenariile privind functionarea sistemului;
un sistem mare este proiectat si implementat de catre mai multe echipe, in perioade diferite, ceea ce impiedica o buna coordonare a activitatii lor si poate conduce la generarea unor solutii a caror integrare ridica uneori probleme in timpul exploatarii;
dezvoltarea unui sistem informational este un proces de durata si pe parcursul proiectarii si implementarii pot sa apara modificari majore in ceea ce priveste legislatia, performantele echipamentelor si produselor program, orientarea activitatii intreprinderii, forma de proprietate, strategia manageriala etc;
personalul care deserveste sistemul castiga experienta si intelege din ce in ce mai bine "ce ar trebui sa faca", uneori in opozitie cu "ce face".
Este necesara o permanenta evaluare a activitatii de mentenanta pentru a observa daca la un moment dat cheltuielile implicate (atat directe cat si indirecte, prin blocarea pe o anumita perioada a sistemului) nu depasesc limitele acceptabile. Daca la un moment dat se considera ca beneficiile sunt puternic afectate de cheltuielile cu mentenanta, se poate concluziona ca sistemul nu mai raspunde necesitatilor si este necesara inlocuirea sa partiala sau totala. In felul acesta se reia ciclul de viata al dezvoltarii sistemului.
Observatie Procesul de proiectare/implementare/exploatare/mentenanta nu este un proces liniar. Rezultatele obtinute la fiecare faza pot impune modificari ale rezultatelor de la fazele anterioare. De exemplu implementarea colectiilor de date poate pune in evidenta dificultati in activitatea de culegere a datelor, lipsa unor date importante ori suprapunerea partiala sau totala a unor informatii (codul numeric personal contine si informatii privind sexul si data nasterii).
Clasificarea datelor unei intreprinderi
Una din etapele de baza ale proiectarii unui sistem informational consta in punerea in evidenta a datelor necesare. Pentru a avea o imagine cat mai clara asupra acestor date, in lucrarea [1] se propune clasificarea lor in functie de trei criterii ortogonale:
nivel de detaliere;
timp;
domeniul de utilizare.
Pentru o mai buna intelegere a acestei clasificari, diferitele categorii de date sunt reprezentate in diagrama din figura 1.4.
Nivelul de detaliere ne indica ce fel de date sunt necesare pentru ca intreprinderea sa-si poata desfasura activitatea.
Datele detaliate sunt date primare ale caror valori nu au fost supuse la nici o transformare. Ele sunt preluate direct din realitatea inconjuratoare (mediul informational brut).
Datele sintetice se obtin prin prelucrarea datelor primare pe baza unor algoritmi specifici.
Fig. 1.4
Exemplu Numele studentilor, numele materiilor, si notele sunt date primare obtinute direct din realitatea inconjuratoare in mediul universitar. Mediile anuale si media finala reprezinta date sintetice.
In general datele statistice si clasamentele sunt prin natura lor date sintetice.
Punerea in evidenta a tuturor datelor detaliate ce vor fi introduse in baza de date este una din sarcinile fundamentale ale proiectantilor de baze de date. Datele sintetice sunt puse in evidenta atat in etapa de proiectare a bazelor de date cat si ulterior in etapa de dezvoltare a aplicatiilor asupra bazei de date.
Timpul permite sa distingem urmatoarele categorii de date:
date istorice;
date curente;
date prognozate.
Datele istorice reprezinta situatia unei intreprinderi sau afaceri la un moment dat anterior momentului analizei.
Prin natura lor aceste date nu pot fi modificate. In cazul unor intreprinderi cu activitate dinamica datele sunt preluate si fixate periodic, la momente de timp bine precizate. Aceste date reprezinta un instantaneu (snapshot).
Exemplu
Situatia profesionala a studentilor - la sfarsitul fiecarei sesiuni.
Cifrele de afaceri - lunar sau trimestrial.
Veniturile - lunar.
Dupa ce a fost fixata intr-un instantaneu, imaginea intreprinderii nu mai poate fi modificata. Din aceasta cauza datele sunt trecute in categoria "istorice" numai dupa ce au fost incheiate toate operatiile de validare si corectare considerate necesare pentru a asigura gradul dorit de credibilitate a datelor.
Operatiile specifice asupra datelor istorice sunt cele de analiza si evaluare.
Datele curente (actuale) sunt date generate de afaceri in curs de desfasurare sau care sunt necesare realizarii unor activitati legate de afacerile in curs de desfasurare.
Exemplu Notele la disciplinele de concurs pentru admiterea la facultate sunt considerate date curente pana la definitivarea clasamentului si rezolvarea tuturor contestatiilor si redistribuirilor. Numai dupa aceea ele pot fi considerate date istorice (de arhiva).
Media finala la admitere poate sa devina data curenta pentru alte activitati de secretariat in cazul studentilor admisi, cu conditia ca valoarea ei sa nu poata fi modificata de nici o aplicatie curenta.
In cazul datelor curente sunt frecvent intalnite operatii de validare, modificare, prelucrare.
Atat datele istorice cat si datele curente pot fi detaliate sau sintetice.
Exemplu Pentru un student notele obtinute la fiecare materie sunt date detaliate iar mediile si clasamentele sunt date sintetice, indiferent cand au fost realizate.
Avand in vedere cele discutate anterior se observa ca din punct de vedere al datelor termenii "trecut" si "actual" sunt relativ vag definiti si au sens numai in raport cu interesul pe care-l reprezinta datele pentru afacerile in curs de desfasurare. Trecerea datelor din categoria "actuale" in categoria "istorice" reprezinta o decizie importanta bazata pe o cunoastere profunda a realitatilor intreprinderii.
Dupa ce datele au fost catalogate "istorice" ele pot fi supuse uneia din urmatoarele operatii:
eliminare (stergere) - daca sunt considerate inutile pentru activitatile viitoare;
arhivare - daca se considera ca la un moment dat ar putea sa apara necesitatea utilizarii lor (arhivarea se face de obicei pe suporturi mai lente, ieftine, de mare capacitate);
trecerea intr-o magazie de date (data warehouse) sau intr-un targ de date (data marts) pentru a putea fi folosite in operatiile de analiza necesare fundamentarii deciziilor.
Datele prognozate reprezinta o imagine a starii intreprinderii proiectata intr-un viitor mai mult sau mai putin indepartat.
In mod natural, pentru o intreprindere data si un moment viitor considerat, corespund mai multe proiectii distincte. Fiecare proiectie este bazata pe un anumit scenariu adica este bazata pe un set de ipoteze privind evolutia intreprinderii in diverse contexte.
Exemplu Cifra de afaceri a unei intreprinderi va avea valori diferite daca se iau in considerare diverse valori ale ratei inflatiei si scenarii diferite privind evolutia legislatiei, contextul politic si social etc.
Valorile prognozate au la baza analizele efectuate asupra datelor istorice si cuente. Credibilitatea datelor prognozate se masoara prin raportarea lor la evolutia datelor istorice in situatii similare. Evident, valorile prognozate au un caracter orientativ, ele fiind insa foarte importante pentru procesul de luare a deciziilor.
Din analiza anterioara se observa ca cele trei categorii de date puse in evidenta nu trebuie privite ca entitati separate. Ele sunt din ce in ce mai mult utilizate impreuna in scopul optimizarii activitatii intreprinderilor.
Domeniul de utilizare reflecta perspectiva segmentului de afaceri si distribuirea managementului datelor intr-o intreprindere. Din acest punct de vedere pot fi puse in evidenta doua mari categorii de date:
date globale (la nivel de intreprindere);
date sectoriale (la nivel de sector de activitate sau segment de afaceri).
Partajarea datelor a fost intotdeauna printre principalele probleme ale gestiunii datelor intr-o intreprindere deoarece aplicatiile sunt dezvoltate in mod natural la nivel local chiar daca ele implica realizarea unei imagini globale a activitatii intreprinderii. De acceea este necesar sa fie puse in evidenta criterii obiective pentru a implementa acele metode de gestiune a datelor care satisfac cel mai bine necesitatile de partajare a datelor pentru fiecare sector de activitate sau segment al afacerii.
Exemplu O universitate poate, in mod natural, sa considere ca fiecare facultate trebuie sa fie capabila sa opereze ca o entitate autonoma si din aceasta cauza va utiliza o arhitectura descentralizata a colectiilor de date, distribuite la nivelul facultatilor. Evident, existenta unor colectii de date locale la nivel de facultate va simplifica multe din operatiile specifice de evidenta a activitatii studentilor (inscrierea studentilor, repartizarea pe formatii de lucru, evidenta situatiei profesionale etc). Exista insa si aplicatii care implica folosirea datelor specifice unei facultati de catre alte facultati sau la nivelul universitatii (de exemplu aplicatiile privind salarizarea, promovarea cadrelor didactice, planurile de invatamant etc). Din aceasta cauza va apare necesitatea rezolvarii unor strategii complexe de partajare a datelor intre aplicatii pentru a optimiza timpul de raspuns. In general aceste strategii sunt mult mai complexe decat cele bazate pe o colectie de date centralizata pentru date curente si istorice detaliate si colectii de date locale pentru datele sintetice corespunzatoare. Pe de alta parte insa utilizarea unor colectii de date centralizate cu multi utilizatori la distanta are si dezavantaje cum ar fi necesitatea utilizarii unui sistem de calcul puternic pentru implementarea unor colectii de date mari, cresterea traficului in retea ceea ce scade viteza de servire a aplicatiilor locale, scaderea protectiei si securitatii datelor etc.
La ora actuala, in cazul unor intreprinderi mari este foarte important sa fie puse in evidenta clar cele doua categorii de date deoarece exista diferente enorme intre pretul de cost si durata implementarii la nivel global respectiv la nivel sectorial.
Transformarea datelor intr-o intreprindere
Crearea colectiilor de date in cadrul sistemului informational al unei intreprinderi nu reprezinta un scop in sine, mai ales daca avem in vedere pretul de cost necesar implementarii. Ele sunt constituite in scopul unei continue adaptari a activitatii intreprinderii la schimbarile din mediul inconjurator in scopul cresterii eficientei acesteia. Pentru a putea servi acestui scop, datele sufera o serie de transformari al caror rezultat final il reprezinta deciziile si actiunile necesare obtinerii rezultatului dorit.
Aceasta succesiune de transformari de la date primare la decizii si actiuni este prezentata sintetic in diagrama din figura 1.5.
Datele primare sunt date brute, fara nici o relevanta. Ele reprezinta o colectie de fapte din realitatea inconjuratoare, prezentate intr-o forma tipizata conform unor standarde sau reguli ad hoc. Aceste date vor fi prelucrate pentru a obtine informatii, cunostinte, intelegerea unor fenomene si vor permite in final luarea unor decizii in scopul determinarii actiunilor optime pentru asigurarea rezultatului dorit.
Prelucrarile pot fi foarte simple sau din contra sa necesite implementarea unor algoritmi sofisticati. Cel mai simplu mod de transformare a unei date fara relevanta in informatie il reprezinta adaugarea unei unitati de masura.
Fig. 1.5
Exemplu
- o data fara semnificatie;
2000 Km - o informatie.
Simpla alaturare a unor date poate genera informatie.
Exemplu
2000 Kg branza - contine evident informatie privind activitatea unei unitati
| | | de alimentatie;
cantitate | ingredient
unitate de masura
Gruparea unor date poate conduce la obtinerea unor informatii deosebit de utile.
Exemplu:
Popa Ion grupa 8301
Craiova, str. Crinului, Nr. 20
telefon 777666
Prin natura lor datele statistice sunt date sintetice ce contin multa informatie privind un anumit domeniu de activitate.
Exemplu:
Tabel 1.1
luna | ||||||||||||
Kg branza |
Acest tabel contine date privind consumul lunar de branza pentru o placintarie. Din aceste date pot fi obtinute informatii privind nivelul afacerilor, principala categorie de utilizatori (elevii), cresterea nivelului de trai etc. Se observa ca interpretarea datelor presupune cunoasterea domeniului la care se refera, aspecte privind contextul in care se desfasoara activitatea, etc. Unele din aceste informatii vor putea fi transformate in cunostinte.
Se observa ca nivelul de detaliere a informatiilor este relativ mare desi se utilizeaza pe scara larga si date sintetice (consumul de branza din exemplul anterior este o data sintetica obtinuta prin totalizarea consumurilor zilnice).
Materializarea informatiei in sistemele informatice moderne se realizeaza in special pe display. Pentru reprezentarea informatiei sunt disponibile 6 dimensiuni:
3 dimensiuni spatiale;
culoarea;
testura;
miscarea (animatia).
La acestea se poate adauga si sunetul, folosit in special ca semnal de alarma sau pentru a sublinia anumite informatii.
In cazul utilizarii imprimantei, sunt disponibile doar 5 dimensiuni (nu se poate utiliza animatia).
Cele mai utilizate variante de afisare a informatiei sunt:
tabele;
grafice;
diagrame.
Varianta aleasa pentru reprezentarea informatiei este foarte inportanta, contribuind substantial la intelegerea si interpretarea informatiei.
In figurile 1.6, 1.7 si 1.8 este reprezentata in diverse variante informatia continuta in tabelul 1.1. Se observa ca variantele din figurile 1.6 si 1.7 sunt mult mai sugestive si pot fi foarte usor citite si interpretate. Varianta din figura 1.8 nu este recomandabila pentru situatia analizata, fiind greu de citit si interpretat.
In general reprezentarile grafice sunt mai putin precise decat cele tabelare dar sunt mult mai sugestive si de aceea sunt preferate in procesele de analiza si luare a deciziilor, cel putin intr-o prima faza, cand sunt mai importante aspectele calitative decat cele cantitative. La ora actuala exista produse program care asigura trecerea foarte simpla de la o forma de reprezentare la alta in functie de necesitati.
Fig. 1.6
Fig. 1.7
Fig. 1.8
Metadatele sunt, asa cum le arata si numele, date despre date. Ele contin informatii privind tipul datelor, posibilitati de acces la date, proprietarul datelor, data generarii unor structuri de date etc. Aceste date sunt pastrate in structuri de date speciale.
Prin analiza, interpretare, abstractizare si generalizare, informatiile devin cunostinte. Noile cunostinte se obtin pe baza vechilor cunostinte si a unor informatii privind contextul in care isi desfasoara activitatea intreprinderea.
Exemplu Analizand informatiile privind variatia cifrei de afaceri ale unei unitati economice intr-un interval dat si adaugand la acestea informatii privind aspectele demografice ale zonei in care isi desfasoara activitatea (numar locuitori, structura socio-profesionala, nivel de cultura etc) se pot formula concluzii generale privind activitatea unitatii. Astfel, daca este vorba despre o unitate de alimentatie publica situata intr-o zona cu multi tineri, in special elevi, este natural sa se concluzioneze ca au cautare mai ales produsele de patiserie, dulciurile, in general produsele ieftine, si ca are loc o cadere puternica a cifrei de afaceri in perioada vacantelor.
Prin generalizare, adica prin ruperea lor de o anumita unitate particulara, aceste concluzii devin cunostinte sub forma:
' Intr-o unitate alimentara situata intr-o zona cu multi elevi se vand bine produsele ieftine, in special produsele de patiserie si dulciurile. Profitul este minim in perioadele de vacanta.'
In aceasta formulare informatia devine valabila pentru orice intreprindere cu acelasi profil si activand in acelasi context. Cunostintele dobandite vor putea fi utilizate in continuare la orientarea profilului unitatii si planificarea activitatii in scopul maximizarii profiturilor.
O etapa superioara o reprezinta intelegerea unei afaceri (activitati) dintr-o intreprindere. Aceasta presupune integrarea cunostintelor din domeniul respectiv in functie de situatiea concreta in care intreprinderea isi desfasoara activitatea. In acest scop divesele informatii si cunostinte specifice domeniului sunt analizate in lumina informatiilor privind dinamica contextului in care se desfasoara activitatea.
Exemplu: Pentru a intelege activitatea unei unitati economice, este necesar ca toate informatiile si cunostintele privind evolutia unitatii sa fie analizate prin prisma concurentei cu alte unitati de profil din zona. Astfel daca se constata ca in timp ce unitatea analizata are dificultati economice alte unitati similare se dezvolta continuu, se poate intelege ca este necesara reorganizarea activitatii, deoarece exista conditii pentru cresterea beneficiului. O analiza profunda poate sa puna in evidenta chiar si directiile in care trebuie actionat (reducerea personalului, cresterea gradului de pregatire a personalului, inbunatatirea managementului, retehnologizare, atragerea unor noi segmente ale pietii etc.). Daca insa se constata ca si celelalte unitati din zona au dificultati similare, este evident ca se pune problema reorientarii activitatii sau chiar desfiintarii intreprinderii.
La acest nivel gradul de detaliere este foarte mic, fiind utilizate in special date sintetice (valori totale, valori medii, informatii statistice). Sunt utilizate atat datele curente cat si datele istorice dar pot fi utilizate si date de predictie generate pe baza unor scenarii imaginate de analisti.
Integrand intelegerea dobandita cu obiectivele naturale ale intreprinderii, rezulta deciziile ce au ca scop optimizarea activitatii intreprinderii. Luarea deciziilor presupune utilizarea pe scara larga a unor date prognozate avand la baza diverse scenarii si utilizarea unor tehnici specifice de optimizare.
Integrarea deciziilor cu resursele disponibile conduce la stabilirea actiunilor ce urmeaza a fi efectuate in scopul atingerii obiectivelor propuse.
Evident, procesul de transformare nu este liniar, putand avea loc reajustari la nivelele inferioare in functie de rezultatele obtinute la nivelele superioare.
In urma analizei anterioare se pot desprinde cateva concluzii foarte importante si anume:
Parcurgerea fiecarei etape de transformare are ca rezultat adaugarea de valoare noua informatiei.
Fiecare etapa reduce gradul de detaliere, generand noi structuri sintetice specifice.
La ora actuala numai primele doua etape de transformare (obtinerea datelor primare si transformarea lor in informatii) pot fi complet automatizate prin utilizarea tehnicii de calcul.
Obtinerea cunostintelor din informatii este inca apanajul aproape exclusiv al omului. Totusi datorita unor tehnici specifice ineligentei artificiale (data mining) la ora actuala in multe domenii particulare pot fi obtinute cunostinte interesante cu ajutorul calculatorului.
Deciziile sunt luate de catre om. Sistemul de calcul asigura doar suportul luarii deciziilor prin furnizarea unor valori prognozate in diverse ipoteze specifice unor scenarii particulare.
Diversele etape de transformare sunt realizate in general de catre echipe diferite. Transformarea datelor primare in informatii este realizata cu ajutorul software-ului aplicativ si al facilitatilor oferite de SGBD-uri, de catre operatori cu o pregatire medie sau superioara. Transformarea informatiilor in cunostinte presupune existenta unor specialisti cu o bogata experienta in domeniu si a unor facilitati software de nivel superior care sa permita realizarea unor modelari si simulari, gasirea unor sabloane comportamentale, depistarea unor invariante, eliminarea unor situatii prea particulare etc. Pe linga specialistii din domeniu echipa poate contine statisticieni, specialisti in inteligenta artificiala, futurologi etc. Intelegerea si decizia sunt probleme specifice organelor de conducere care elaboreaza tacticile si strategia intreprinderii. Factorii de decizie nu sunt intotdeauna specialisti de inalta clasa in domeniul respectiv, ei dispun insa de mijloacele materiale si morale necesare transformarii deciziilor in actiuni. Pentru fundamentarea corecta a deciziilor ei au nevoie de toate informatiile si cunostintele obtinute anterior (prezentate intr-o forma sintetica cat mai usor de citit si interpretat) dar si de consilieri cu o pregatire de nivel inalt in domeniu. Actiunile sunt proiectate de echipe subordonate factorilor de decizie. Acestea trebuie sa aiba o imagine foarte clara asupra resurselor de care dispune intreprinderea pentru ca actiunile sa corespunda cat mai mult deciziilor de la nivel superior si sa poata fi executate in timp util.
Fundamentul intregului lant de transformari il reprezinta transformarea datelor primare in informatii. Din aceasta cauza in literatura de specialitate transformarea datelor semnifica de fapt transformarea datelor primare in informatii.
1.4 Entitati, atribute, legaturi
1.4.1 Definitii, proprietati
Se numeste entitate orice obiect, fenomen, concept ce poate fi distins prin valorile caracteristicilor sale de alte obiecte, fenomene sau concepte asemanatoare.
Se numeste atribut o caracteristica specifica unei entitati.
O multime de entitati descrise de acelasii set de atribute formeaza o clasa de entitati.
Clasa de entitati este o reprezentare abstracta si generalizata a entitatilor.
Exemplu: Pentru a pune in evidenta diferenta dintre o entitate si clasa de entitati, vom analiza diagrama din figura 1.9. In aceasta figura (1100, DA-754321, Popescu, Ion, M, 2-3-1975, N, 8503) reprezinta entitatea studentul Popescu I. Ion , cu numarul de inmatriculare 1100, buletin seria DA numar 754321, sex masculin, nascut pe data de 2-3-1975, necasatorit, repartizat in grupa 8503.
Prin abstractizare si generalizare a fost generata clasa de entitati STUDENT cu structura:
STUDENT(NR_LEG, BULETIN, NUME, INITIALA, PRNUME,SEX,DATA_NASTERE, STARE_CIVILA, GRUPA)
Raportul intre entitati si clasa de entitati STUDENT este prezentata in figura 1.9.
Fiecare clasa de entitati se identifica printr-un nume.
Fiecare atribut se identifica printr-un nume.
Un atribut se specifica prin nume, semantica, structura si gama valorilor.
Observatie: Se recomanda ca numele claselor de entitati sau ale atributelor sa reflecte cat mai clar semnificatia acestora.
Semantica atributului reprezinta semnificatia pe care o are atributul intr-o entitate
Exemplu STARE_CIVILA reprezinta starea civila a studentului (necasatorit, casatorit, divortat, vaduv, decedat).
Din punctul de vedere al semanticii distingem:
atribute identificator, ale caror valori pot identifica in mod unic o anumita entitate
Fig. 1.9 |
Exemplu NR_LEG reprezinta numarul de legitimatie al unui student si este natural sa se considere ca la un moment dat nu exista doi studenti cu acelasi numar de legitimatie deci numarul de legitimatie permite identificarea riguroasa a unui student.
atribute descriptor, ale caror valori descriu o anumita proprietate a entitatii
Spre deosebire de atributele identificator, o anumita valoare a unui atribut descriptor poate fi comuna mai multor entitati deci nu poate individualiza o anumita entitate.
Exemplu NUME este un atribut descriptor deoarece mai multi studenti pot avea acelasii nume.
Observatii:
Proprietatea de atribut identificator trebuie sa decurga din semantica datelor in sensul ca ea trebuie sa fie invarianta in timp. Nu se poate decide doar pe baza unor situatii conjuncturale ca un atribut este identificator ( chiar daca la un moment dat intr-un colectiv nu exista doua persoane cu acelasi nume, atributul NUME nu poate fi declarat identificator deoarece unicitatea nu este garantata de semantica atributului).
O clasa de entitati poate avea mai multe atribute identificator distincte. Dintre acestea se alege un atribut identificator numit atribut cheie primara, utilizat pentru identificarea entitatilor unei clase de entitati.
Exemplu In clasa de entitati STUDENT exista doua atribute identificator NR_LEG si BULETIN. Putem desemna oricare din cele doua atribute ca fiind atribut cheie primara
Din punctul de vedere al structurii se pot distinge:
atribute atomice, din a caror valoare nu poate fi eliminata nici o componenta fara a afecta semantica atributului
Exemplu BULETIN este un atribut atomic deoarece eliminand seria sau numarul din valoarea atributului, acesta isi va pierde semnificatia de identificator al entitatii STUDENT
atribute compuse, a caror valoare este data de reuniunea valorilor unor atribute atomice
Exemplu Atributul BULETIN din clasa de entitati STUDENT poate fi inlocuit prin atributele SERIE_BULETIN si NUMAR_BULETIN. Cele doua atribute vor forma un atribut identificator compus avand aceeasi semnificatie ca si atributul initial(BULETIN)
Gama valorilor reprezinta multimea tuturor valorilor pe care le poate lua un atribut (domeniul de definitie al atributelor)
Gama de valori poate fi in anumite situatii foarte larga iar in alte situatii se poate reduce la o lista finita de valori.
Exemplu
NUME - sir de caractere cu lungimea maxima 40 caractere ;
STARE_CIVILA
O categorie speciala de valori o reprezinta asa numita valoare nula. Valoarea nula este o valoare diferita de orice valoare admisa pentru un atribut si necesita operatori speciali de prelucrare. Valoarea nula trebuie sa semnifice lipsa unei valori pentru un anumit atribut. O eroare frecvent intalnita este aceea de a confunda valoarea nula a unui atribut numeric cu 0 si valoarea nula a unui atribut alfanumeric cu caracterul "spatiu".
Din punctul de vedere al numarului de valori pe care le poate lua la un moment dat un atribut pentru o anumita entitate, se disting:
atribute cu valoare unica, care accepta o singura valoare pentru fiecare entitate
atribute multivaloare, care accepta un set de valori pentru aceeasi entitate
Exemplu Pentru clasa de entitati ECHIPAMENTE (COD_E, NUME_E, COMPONENTE) atributele COD_E si NUME_E sunt atribute cu valoare unica in timp ce atributul COMPONENTE este un atribut multivaloare
Observatie: In literatura de specialitate, pentru a simplifica exprimarea, in locul expresiei "clasa de entitati" se utilizeaza uneori termenul "entitate" iar o particularizare a entitatii se numeste "realizare a entitatii".
Intr-un domeniu de activitate oarecare entitatile nu sunt independente ci interactioneaza intre ele pentru realizarea anumitor obiective.
Legatura intre clasele de entitati pune in corespondenta entitatile ce participa la realizarea legaturii, pe baza unui criteriu bine definit
Cu alte cuvinte se poate spune ca legatura intre clasele de entitati reprezinta o submultime a produsului cartezian al entitatilor. Deci din punct de vedere matematic legatura intre entitati este o relatie definita peste multimile realizarilor entitatilor.
Pentru a intelege caracteristicile legaturilor intre clasele de entitati, vom considera diagrama din figura 1.10, in care prin dreptunghiuri sunt reprezentate clasele de entitati, prin dreptunghi cu colturi rotunde atributele iar prin arc cu sageata dubla legaturile intre clasele de entitati.
|
Fig. 1.10
Indiferent de natura claselor de entitati, legaturile dintre acestea au citeva caracteristici generale:
Orice legatura are o semnificatie (semantica) bine definita.
In exemplul analizat, pentru legaturile figurate au fost propuse urmatoarele semnificatii:
L1 - studentul X este casatorit cu studenta Y;
L2 - studentul X are adresa stabila Y;
L3 - studentul X are adresa flotanta Y;
L4 - studentul X a obtinut nota N;
L5 - studentul X studiaza materia M;
L6 - studentul X studiaza cursuri cu titularul T;
L7 - titularul T preda materia M;
L8 - nota N a fost atribuita la materia M ;
L9 - titularul T a acordat nota N;
L10 - studentul X a obtinut nota N la materia M predata de titularul T.
Fiecare legatura are un nume
Numele trebuie astfel ales incat sa sugereze cat mai bine semantica legaturii. Denumiri de felul celor din figura 1 (L1-L10) nu sunt recomandate in aplicatiile practice deoarece nu au nici o semnificatie pentru cel care citeste diagrama. Este mult mai rational ca in loc de L2 sa utilizam LOCUIESTE_LA_ADR_STAB iar in loc de L3 sa utilizam LOCUIESTE_LA_ADR_FLOT care sugereaza foarte clar semantica legaturilor.
O legatura este bidirectionala.
Intr-adevar, pentru legatura L1 au sens atat formularea:
"Studentul Si este casatorit cu studenta Sj"
cat si formularea
"Studenta Sj este casatorita cu studentul Si".
Aceasta proprietate justifica reprezentarea legaturilor prin arc cu sageata dubla.
Pot fi definite legaturi intre entitatile aceleeasi clase de entitati.
In diagrama prezentata apare legatura L1 care pune in corespondenta studenti ai aceleasi facultati.
Intre doua clase de entitati pot fi definite mai multe legaturi cu semnificatii diferite
Intre clasele de entitati STUDENTI si ADRESE au fost definite legaturile L2 si L3 cu semnificatii diferite.
Pot fi definite legaturi peste mai multe clase de entitati
In general astfel de legaturi sunt mult mai bogate in informatie decat legaturile directe intre clasele de entitati membre ale legaturii. Astfel, legatura L10 ofera informatii pe care nu le poate oferi nici una dintre legaturile ce leaga doar doua din clasele de entitati ce participa la realizarea legaturii (L4, L5, L6, L7, L8, L9).
Legaturile pot avea atribute proprii.
Intr-adevar, in anumite situatii legaturile pot avea anumite caracteristici specifice care nu pot fi atasate in mod natural ca atribute ale uneia din clasele de entitati ce participa la legatura. Astfel, este mult mai natural sa consideram DATA_EXAMEN ca un atribut atasat legaturii L10 decat uneia din cele patru entitati ce participa la legatura deoarece legatura defineste in mod evident rezultatele unui examen.
Observatie: In practica este uneori dificil de stabilit daca avem de-a face cu un atribut, o entitate sau o legatura, daca un atribut trebuie atasat legaturii sau uneia din clasele de entitati ce participa la legatura etc. Rezolvarea acestor probleme va fi abordata detaliat in partea a II-a a cursului.
Indicatori de calitate a legaturilor
Avand in vedere importanta practica deosebita a cunoasterii legaturilor intre clasele de entitati, au fost pusi in evidenta cativa parametri cantitativi a caror cunoastere este obligatorie pentru intelegerea si implementarea legaturilor.
Gradul legaturii
Gradul legaturii indica numarul de clase de entitati ce participa la realizarea legaturii
Din acest punct de vedere distingem:
a) legaturi unare - definite intre realizarile aceleasi entitati.
b) legaturi binare - definite intre realizarile a doua entitati distincte.
c) legaturi de grad superior - definite intre realizarile a cel putin trei entitati distincte.
Exemplu: In diagrama din figura 1.10 legatura L1 este unara, legaturile L2-L9 sunt binare iar legatura L10 este de grad 4
In practica se evita pe cat posibil utilizarea legaturilor de grad superior prin descompunerea acestora fara pierdere de informatie in legaturi de grad mai mic.
Indicator de participare
Se numeste realizare a legaturii un set particular de entitati puse in corespondenta prin acea legatura
Exemplu In figura 1.11 sunt reprezentate cateva din realizarile legaturilor L2(linie plina) si L3 (linie punctata).
Fig. 1.11
Evident, nu toate entitatile unei clase de entitati pot participa la realizarea unei anumite legaturi.
Exemplu Pentru legatura L1 doar un numar mic de studenti sunt casatoriti cu studente din aceas facultate, deci majoritatea entitatilor corespunzatoare studentilor facultatii nu vor participa la realizarea legaturii In schimb orice student trebuie sa studieze cel putin o materie deci entitatile corespunzatoare tuturor studentilor trebuie sa participe la realizarea legaturii L5.
Se numeste indicator de participare un indicator care specifica daca pot exista entitati ale unei clase de entitati care sa nu participe la realizarea legaturii analizate
Daca toate entitatile unei clase de entitati participa obligatoriu la realizarea unei legaturi, se spune ca indicatorul de participare al clasei de entitati la realizarea legaturii are valoarea obligatoriu .
Daca exista entitati ale unei clase de entitati, care nu participa la realizarea unei legaturi, se spune ca in raport cu acea legatura valoarea indicatorului de participare este optional.
Exemplu Pentru L1 indicatorul de participare are valoarea optional iar pentru L5 are valoarea obligatoriu.
Cunoasterea acestui indicator este foarte importanta in faza de proiectare a bazei de date.
Indicatorul de conectivitate al legaturii
Indicatorul de conectivitate al legaturii indica numarul de entitati ale unei clase de entitati care pot fi puse in corespondenta cu entitati ale celorlalte clase de entitati ce participa la realizarea legaturii
Pentru a intelege semnificatia acestui indicator se va considera cazul legaturilor binare.
Fie E1 si E2 doua clase de entitati oarecare ale caror entitati pot fi puse in corespondenta prin legatura L. Din punctul de vedere al indicatorului de conectivitate pot fi puse in evidenta trei tipuri de legaturi:
a) L de tipul 1:1 - cand o entitate a clasei de entitati E1 poate fi pusa in corespondenta cu cel mult o entitate a clasei de entitati E2 si o entitate a clasei de entitati E2 poate fi pusa in corespondenta cu cel mult o entitate a clasei de entitati E1;
b) L de tipul 1:M - cand o entitate a clasei de entitati E1 poate fi pusa in corespondenta cu n (n>1) entitati ale clasei de entitati E2 dar o entitate din E2 poate fi pusa in corespondenta cu cel mult o entitate a clasei de entitati E1;
c) L de tipul M:M - cand o entitate a clasei de entitati E1 poate fi pusa in corespondenta cu n (n>1) entitati ale clasei de entitati E2 si o o entitate din E2 poate fi pusa in corespondenta cu m (m>1) entitati ale clasei de entitati E1.
Pentru legaturile unare definirea indicatorului de conectivitate se face in acelasii mod cu conditia ca entitatile E1 si E2 sa aiba exact aceleasi realizari.
Pentru legaturile de grad superior definirea indicatorului de conectivitate este mai complicata si va fi abordata in partea a II-a a cursului.
Cunoasterea indicatorului de conectivitate al legaturii este deosebit de importanta in faza de proiectare a bazei de date.
Exemple Legatura L2 este de tipul 1:M deoarece un student are cel mult o adresa stabila in timp ce la o adresa stabila pot locui mai multi studenti. Legatura L6 este de tipul M:M deoarece un student studiaza cu mai multi titulari iar un titular preda acceasi materie la mai multi studenti
Valoarea acestui indicator trebuie stabilita pe baza cunoasterii profunde a semanticii datelor si nu doar pe baza unor situatii conjuncturale. De exemplu, se poate intampla ca la un moment dat sa nu existe doi studenti locuind la aceeasi adresa stabila dar aceasta nu inseamna ca indicatorul de conectivitate al legaturii L2 este 1:1 deoarece este posibil ca la un moment dat sa apara mai multi studenti cu aceas adresa stabila.
Proprietate: Orice legatura de tipul M:M poate fi descompusa fara pierdere de informatie intr-o succesiune de doua legaturi de tip 1:M prin introducerea unei noi clase de entitati numita entitate conector (EC) care contine perechi de identificatori ai realizarilor entitatilor din legatura initiala. Modul de realizare al descompunerii este prezentat in figura 1.12.
Exemplu Presupunand ca in legatura L6 entitatile au cheile primare NR_LEG_STUD respectiv NR_LEG_TIT, legatura poate fi transformata ca in figura 1.13 unde entitatea conector are structura PREDA/AUDIAZA (NR_LEG_TIT, NR_LEG_STUD)
|
Fig. 1.12
Fig. 1.13 |
Relatia intre entitati, legaturi, date si informatie
Valorile atributelor reprezinta date brute, fara nici o valoare informationala sau cu un continut informational foarte redus.
Alaturare datelor in cadrul unei entitati creaza informatie. Deci structura datelor unei entitati este cea care contine informatia specifica entitatii.
Legatura intre clase de entitati pune in corespondenta pe baza unei reguli precise entitati ale aceleasi clase de entitati ori a doua sau mai multe clase de entitati diferite si prin aceasta creaza informatie. Materializarea legaturile presupune crearea de noi structuri de date, de complexitate sporita si cu continut informational mai mare decat al fiecareia dintre entitatile ce participa la realizarea legaturii. In general, cu cat structura datelor este mai complexa si continutul ei informational este mai bogat.
Evident, structura datelor nu este apanajul informaticii. Orice document reprezinta de fapt materializarea unei structuri de date.
Exemplu Se considera tabelele STUDENTI si ADRESE din figura 1.14
STUDENTI
NR_LEG |
NUME |
PRENUME |
SEX |
DATA_NASTERE |
SECTIA |
GRUPA |
Marinescu |
Ilie |
M |
C | |||
Popescu |
Dana |
F |
A | |||
ADRESE
NR_LEG |
TIP |
LOCALITATE |
STRADA |
NR |
BL |
ET |
AP |
OBSERVATII |
S |
Bals |
Dudului | ||||||
F |
Craiova |
Doljului | ||||||
S |
Craiova |
Caracal | ||||||
Fig. 1.14
Analizand oricare dintre coloanele celor doua tabele se observa ca valorile inscrise contin foarte putina informatie. De exemplu din coloana LOCALITATE putem deduce doar ca avem studenti care locuiesc in Craiova, Bals etc. dar nu stim daca este adresa stabila sau flotanta, cine locuieste in Craiova si cine in Bals.
Daca se analizeaza linia marcata in tabelul STUDENTI, se observa imediat ca aceasta materializeza o entitate si anume studentul Popa Ion, cu legitimatia Nr. 1379, sex masculin, nascut pe data 13-10-1975, de la sectia Calculatoare, anul 4, grupa 8406. Evident toate aceste informatii au putut fi obtinute numai daca se cunosc metadatele corespunzatoare tabelului, adica numele tabelului, numele coloanelor(atributelor), semnificatia coloanelor, modul de codificare al numarului de grupa. Daca nu s-ar cunoaste de exemplu regula de generare a numarului unei grupe nu se putea trage concluzia ca studentul este in anul 4.
Legaturile L2 si L3 din diagrama anterioara au fost materializate prin introducerea coloanelor NR_LEG si TIP in tabelul ADRESE. Prin valorile atributului NR_LEG se poate realiza corespondenta intre un anumit student si adresa stabila sau adresa flotanta ale acestuia iar prin valorile adtributului TIP se face distinctie intre cele doua legaturi (S pentru adresa stabila si F pentru adresa flotanta). Evident datele obtinute prin implementarea unei legaturi contin mult mai multa informatie decat datele fiecarei entitati in parte. Astfel, pe baza celor doua legaturi vom obtine:
Studentul Marinescu Ilie, cu legitimatia Nr. 1390, sex masculin, nascut pe data 13-11-1973, de la sectia Calculatoare, anul 4, grupa 8306 are adresa stabila in Bals, strada Dudului Nr. 3 si adresa flotanta in Craiova, str. Doljului, Bl. G9, Et. 5, Ap. 95.
Din punctul de vedere al structurarii datelor se disting doua mari categorii de date:
date puternic structurate- cu o structura rigida si riguros definita (tabele, fise, facturi, chitante, cataloage etc);
date slab structurate- cu o structura variabila, vag definita (imagini, documente olografe, inregistrari audio sau video etc).
Datele puternic structurate sunt specifice unor activitati financiar contabile, evidenta, statistica etc. Datele slab structurate sunt specifice aplicatiilor multimedia.
In domeniul informatic se pot distinge doua categorii de structuri de date si anume:
structuri volatile- implementate in memoria principala a calculatorului (date elementare, inregistrari, liste, arbori etc.);
structuri persistente- implementate in memoria secundara a calculatorului(fisiere).
Fisierele sunt structurile fundamentale in pastrarea datelor. Structurile volatile sunt utilizate pe scara larga in procesele de transformare a datelor in informatie.
Asa cum s-a vazut anterior datele in sine nu reprezinta informatie. Pentru a obtine informatie este necesar ca la date sa fie asociate metadate.
Metadatele reprezinta "date despre date" adica date care descriu datele
Descrierea structurii datelor, restrictiile de integritate a datelor, regulile de acces la date, regulile de generare a unor date, informatii privind proprietarul datelor, data generarii structurii de date, reprezinta exemple tipice de metadate.
Se observa importanta deosebita a descrierii structurii datelor in gestiunea si prelucrarea informatiei. Separarea descrierii structurii datelor de datele propriuzise este un concept fundamental in metodele moderne de gestiune a datelor.
Intrebari recapitulative
Care este deosebirea fundamentala intre informatie si materie?
Ce sunt datele primare? Dati exemple din activitatea curenta.
Ce intelegeti prin abstractizare si generalizare? Dati exemple din activitatea curenta.
Care sunt indicii de calitate ai informatiei? Exemplificati raportul intre acesti indici prin exemple din activitatea curenta.
Care sunt principalele etape ale ciclului de prelucrare a datelor?
Ce este un document primar? Dati exemple din activitatea curenta.
Ce tipuri de codificare a datelor cunoasteti?
Dati exemple de codificare externa din activitatea curenta.
Ce culori se recomanda pentru afisarea informatiei si de ce?
De ce se evita utilizarea unor fonduri sonore la afisarea informatiei pe ecran?
Ce reprezinta un font?
De ce nu se recomanda utilizarea pe scara larga a caracterelor italice?
Ce este un fisier? Ce tipuri de fisiere cunoasteti?
Definiti termenii "intreprindere" si "afacere". Dati exemple din activitatea curenta.
Ce este un sistem informational? Dati exemple din activitatea curenta.
Ce este un prototip?
Care este deosebirea intre conceptele "mentenanta" si "intretinere"?
Dati exemple din activitatea curenta de date istorice sintetice.
Dati exemple din activitatea curenta de date curente detaliate.
Care sunt etapele de transformare a datelor in decizii? Dati exemple din activitatea curenta.
Ce sunt metadatele? Dati exemple din activitatea curenta.
Ce este clasa de entitati?
Ce tipuri de atribute cunoasteti? Dati exemple din activitatea curenta.
Care sunt proprietatile generale ale legaturilor? Exemple.
Care sunt indicatorii de calitate ai legaturilor? Dati exemple din activitatea curenta.
Dati exemple din activitatea curenta de legaturi M:M si transformati-le in legaturi de tipul 1:M.
Copyright © 2025 - Toate drepturile rezervate