Biologie | Chimie | Didactica | Fizica | Geografie | Informatica | |
Istorie | Literatura | Matematica | Psihologie |
Baza de date reprezinta una sau mai multe colectii de date aflate in interdependenta impreuna cu descrierea datelor si a relatiilor dintre ele.
Colectia de date reprezinta un ansamblu de date organizat dupa anumite criterii.
Descrierea datelor se intalneste sub denumirile de catalog de sistem, dictionar de date sau meta-date ceea ce reprezinta date despre date. Relatiile logice reprezinta asociatiile dintre mai multe entitati. O entitate este un obiect distinct ce trebuie reprezentat in baza de date.
Un atribut este o proprietate ce descrie un anumit aspect al obiectului ce se inregistreaza in baza de date.
In sistemele de baze de date definirea datelor se separa de programele aplicatie, utilizatorii vad doar definitia externa a unui obiect fara a cunoaste modul in care e definit acesta si cum functioneaza. In acest mod, definitia interna a obiectului poate fi modificata fara a afecta utilizatorii acestuia daca nu se modifica definitia externa. De exemplu, daca sunt adaugate noi structuri de date sau sunt modificate cele existente, atunci programele aplicatie nu sunt afectate daca nu depind direct de ceea ce se modifica.
In bazele de date are loc o integrare a datelor, in sensul ca mai multe fisiere sunt privite in ansamblu, eliminandu-se pe cat posibil informatiile redondante. De asemenea, se permite accesul simultan la aceleasi date, situate in acelasi loc sau distribuite spatial, a mai multor persoane de pregatiri diferite, fiecare cu stilul personal de lucru.
In ultimii cincizeci de ani, productia si utilizarea tehnicii de calcul - hardware si software - a cunoscut o dezvoltare dramatica. Ea reprezinta o parte semnificativa din produsul national brut al tarilor industrializate; In SUA, de exemplu, peste 50% din capitalul investit este cheltuit pe tehnologie de calcul. Costul "informatiei' a ajuns la 1 trilion de dolari SUA (aproximativ produsul national brut al Marii Britanii) in anul 2000 si este estimat la peste 1,5 trilioane in 2005 (prognoza realizata de Michael Spindler - fost presedinte la Apple Computer).
Produsele program au depasit de mult teritoriul centrelor de calcul. Ele sunt incorporate si controleaza echipamente industriale (linii tehnologice automate, masini cu comanda numerica, roboti), mijloace de transport si de comunicatii, tranzactii financiare si bancare, retele energetice, sisteme de aparare nationala, etc. Odata cu perfectionarea tehnicilor "virtual realty" si multimedia, calculatorul este tot mai folosit ca mijloc didactic sau de divertisment si in activitati de conceptie.
Tehnologia informatiilor face permanente modificari mijloacelor de munca in intreaga lume. Informatii care erau altadata stocate in depozite pline de dulapuri pot fi accesate acum la o singura apasare a butonului mouse-ului. Pentru a stoca informatii in orice mediu imaginabil in zilele noastre sunt folosite sisteme de baze de date. De la bazele mari de date, cum ar fi sistemele de rezervare a biletelor ale companiilor aeriene si pana la colectia de fise dintr-un cabinet medical, sistemele de baze de date sunt folosite pentru memorarea si distribuirea datelor de care incep sa depinda vietile noastre. Pana in urma cu cativa ani, sistemele mari de baze de date puteau fi executate numai pe calculatoare de tip mainframe. In mod obisnuit, era foarte costisitor sa fie proiectate, achizitionate si intretinute aceste masini. O data cu aparitia calculatoarelor din clasa statiilor de lucru, care sunt puternice si ieftine, programatorii au posibilitatea de a proiecta rapid si ieftin produse software pentru intretinerea si distribuirea datelor.
Cel mai folosit model de stocare a datelor este baza de date relationala. Acest nou model s-a dezvoltat pornind de la un articol, "A Relational Model of Data for Large Shared Data Banks" (Un model relational al datelor pentru banci mari de date folosite in comun), scris de Dr. E. F. Codd in anul 1970. Ideea lui Codd pentru un sistem de administrare a bazelor de date relationale foloseste conceptele matematice de algebra relationala pentru a grupa datele in multimi si a stabili relatii intre submultimile (domeniile) comune.
In plus fata de dezvoltarea unui model de baza de date relationala, alte doua tehnologii au condus la dezvoltarea rapida a ceea ce acum este numit un sistem de baze de date client/server.
Prima tehnologie importanta a fost calculatorul personal, care a facut posibil ca aplicatii ieftine, usor de folosit, sa permita utilizatorilor crearea documentelor si administrarea datelor rapid si corect. Utilizatorii sau obisnuit sa modernizeze continuu sistemele, deoarece rata schimbului a fost echilibrata rapid de scaderea pretului celor mai avansate sisteme.
A doua tehnologie importanta a fost dezvoltarea retelelor locale de calculatoare (LAN). Desi utilizatorii erau obisnuiti cu terminalele conectate la calculatorul mainframe comun, acum fisierele procesate puteau fi stocate local si accesate de la orice calculator atasat in retea. Totodata, cantitati mari de date puteau fi transferate la servarele de date departamentale.
In acest context, sistemul, denumit client/server deoarece procesarea este separata intre calculatoarele client si un server de baze de date, constituie o modificare radicala de la programarea aplicatiilor bazata pe calculatoarele mainframe. Aceasta arhitectura este total recursiva, pe rand servarele putand deveni clienti si cere servicii de la alte servere din retea. Datorita puterii crescute a hardware-ului calculatoarelor personale, informatiile critice (importante) ale bazei de date pot fi memorate pe un server independent, care poate fi inlocuit mai tarziu cu foarte putine (sau chiar fara) modificari.
Ultima dintre arhitecturile dezvoltate este cea a aplicatiilor distribuite pe web. Clientul devine o aplicatie cat mai simpla posibil, accesata de obicei printru banal browser de internet. Serverul de date si cel de aplicatii web preiau cea mai mare parte a sarcinilor, fiind plasate in general pe calculatoare puternice. Se revine astfel la structura (oarecum) centralizata, dar pe o spirala evidenta a tehnologiei.
Complexitatea actuala a aplicatiilor de management al bazelor de date face necesara o combinatie a procesarii tranzactiilor on-line, a incarcarii si a cresterii sprijinului decizional. In scopul satisfacerii acestor necesitati, este nevoie de baze de date scalabile si performante care pot fi ajustate dinamic pentru a realiza un compromis intre bazele de date (mai mari) si utilizatorii simultani (mai multi). De asemenea, sunt necesare tehnologii pentru baze de date proiectate pentru a maximiza capacitatile configuratiei hardware/software disponibile (incluzand arhitecturi simplu si multi-procesor), precum si
pentru valorificarea unor arhitecturi hardware (cum ar fi clustere cuplate larg si masini paralele puternice). Serverele de date de astazi se apropie de aceste cerinte - o arhitectura paralela (de noua generatie) a bazelor de date care furnizeaza scalabilitate, manevrabilitate si performanta; o regie minimala a sistemului de operare; si o distribuire automata a incarcarilor de lucru. Arhitectura multifilara este proiectata pentru a utiliza cat mai bine resursele hardware si poate fi reconfigurata dinamic on-line pentru a urmari cererile in schimbare.
Performanta este aspectul critic al succesului, si avand in vedere cresterea dramatica a numarului de utilizatori, date fiind aplicatiile de comert electronic si noile modele de calcul, presiunea exercitata asupra bazelor de date este mai mare ca oricand.
Datele sunt fapte culese din lumea reala pe baza de observatii si masuratori. Ele constituie orice mesaj primit de la un receptor sub o anumita forma.
Colectia de date reprezinta un ansamblu de date organizat dupa anumite criterii. Fisierul reprezinta o colectie de date organizata dupa criterii calitative, de prelucrare si scop.
Organizarea datelor - reprezinta procesul de definire si structurare a datelor in colectii, gruparea lor precum si stabilirea elementelor de legatura intre componentele colectiei si intre colectii.
Evolutia in timp a metodelor de organizare a datelor e legata de solutiile tehnice de inmagazinare a datelor si cuprinde nivelele:
1. Nivelul I - organizarea datelor in fisiere clasice
2. Nivelul II - organizarea mixta in fisiere
3. Nivelul III - organizarea datelor in bazele de date clasice
4. Nivelul IV - organizarea datelor in bazele de date relationale
5. Nivelul V - organizarea datelor in baze de date distribuite
In cadrul acestei evolutii se disting etapele:
1. Etapa I - e perioada caracterizata de inregistrarea datelor pe benzi magnetice. Aceasta etapa se apropie mult de sistemul manual de organizare a datelor (indosariere - Datele sunt organizate, in principal, sub forma de fisiere secventiale datorita suportului magnetic (benzi)).
Caracteristici:
a) Structura logica - coincide cu cea fizica. Prin urmare, programatorul trebuie sa descrie si organizarea fizica a datelor pe suport, lucru incomod, la schimbarea suportului;
b) Prelucrarea se face pe loturi;
c) Dependenta aplicatiilor fata de date. O modificare in structura datelor sau a dispozitivului de memorare implica modificari ale programelor de aplicatie si recompilarea lor;
d) Redundanta mare. In memorarea datelor datorita faptului ca aceleasi date sunt memorate separat pentru fiecare aplicatie ce are nevoie de ele;
e) Programele realizeaza numai operatii simple de intrare/iesire.
2. Etapa II - e caracterizata de inregistrarea datelor pe discul magnetic. Datele se pot organiza acum atat in fisiere secvential-indexate cat si in fisiere cu acces direct.
Caracteristici:
a) Structura logica nu mai coincide cu cea fizica. Programatorul nu mai trebuie sa descrie si organizarea fizica a datelor pe suport, acest lucru fiind facut de catre componentele specializate ale sistemului de operare;
b) prelucrarea se face online sau in timp real;
c) schimbarea unitatii de memorare nu implica modificarea programelor;
d) se mentine redundanta mare;
e) accesul se face la nivel de inregistrare si nu de camp in cadrul inregistrarii;
f) nu se realizeaza accesul dupa chei multiple;
g) legaturile intre fisiere trebuie programate.
3. Etapa III - e caracterizata de aparitia bazelor de date. Datele se pot organiza acum sub forma unor fisiere integrate. Acestea permit realizarea mai multor fisiere logice pe baza acelorasi date fizice.
Caracteristici:
a) Organizarea fizica a datelor e independenta de programele de aplicatii;
b) Se pot constitui fisiere logice in functie de baza de date;
c) Se reduce redundanta datelor fiind posibila folosirea in comun a acelorasi date fizice de catre mai multe aplicatii;
d) Accesul la date se face la nivel de camp;
e) E permis accesul dupa chei multiple;
f) Existenta unor masuri de protectie si securitate a datelor;
g) Organizarea datelor e realizata de o componenta software (data management).
4. Etapa IV - se caracterizeaza prin asigurarea independentei logice si fizice a datelor fata de programele de aplicatie. Aceasta se realizeaza prin intermediul administratorului de baze de date cu ajutorul descrierii datelor la un nivel logic global.
Caracteristici:
a) Datele sunt descrise la nivel logic global.
b) Existenta unor fisiere inverse ce permit raspunsul rapid la intrebari formulate de utilizatori.
c) Marirea gradului de protectie si securitate a datelor.
d) In afara independentei fizice a datelor apare si independenta logica prin posibilitatea existentei unor modificari in structura logica fara a afecta aplicatiile.
e) redundanta datelor e redusa la minim.
Copyright © 2024 - Toate drepturile rezervate