Biologie | Chimie | Didactica | Fizica | Geografie | Informatica | |
Istorie | Literatura | Matematica | Psihologie |
STANDARDE SI NORME PENTRU DOCUMENTELE ELECTRONICE
"Norma este un document stabilit printr-un consens si aprobat de catre un organism recunoscut, care, furnizeaza, pentru intrebuintari comune si repetate, reguli, linii directoare sau caracteristici, pentru activitati sau rezultatele lor, garantand un nivel de ordin optimal intr-un context dat" (Eric Sutter).
Literatura de specialitate nord americana nu face distinctie intre norma si standard accentul punandu- se pe aspectul normativ si acceptat al unor reguli. In spatiul european, si in special francez intalnim si termenul norma si termenul standard diferentele semantice nefiind foarte semnificative.
Tipuri de norme[2]:
ASCII (American Standard Code for Information Interchange) (ISO 641)
Codatorul de joc de caractere cel mai utilizat. Contine 7 biti pe caracter; este limitat la 128 caractere in principal in engleza.
ISO Latin 1 (ISO 8859-1:1987, partea 1)
Extinderea curenta si inlocuirea codului ASCII, "Latin 1" este jocul de caractere cel mai utilizat de ISO 8859-n (n=1-9), o serie de noua caractere alfabetice de 8 biti, pentru un total de 256, si este destinat in principal limbilor europene. Utilizat de Windows.
UNICODE (ISO 10646-1 joc de caractere universale)
Cod de caractere de 16 biti care urmareste sa acopere toate sistemele de scriere din lume. Nu este utilizat la scara mare in acest moment, desi XML il sustine.
formate de text proprietate
MSWORD, WordPerfect, etc. (aplicatii de tratare de text).
Sistemul de codificare este de tip proprietar, in asa fel incat aceasta poate reprezenta o problema de transfer intre pachetele de programe sau chiar intre diferitele versiuni ale aceluiasi pachet de programe. Utilizat in mod curent pentru textele care pot fi revizuite. Poate contine parti de fisiere multimedia.
Formatul RTF (Rich Text Format)
Un format intrare-iesire portabil pentru numeroase pachete de programe de tratare a textului concepute de Microsoft.
formate de descriere de pagini
Aceste formate descriu forma pe pagina, adica dispunerea unui document dar nu si continutul sau structura sa. Utilizat pentru prezentarea pentru lectura simpla a imaginilor de pagini finale formatate pentru iesire pe orice fel de imprimanta sau orice alt periferic de iesire. Folosit din ce in ce mai mult pentru publicatiile electronice.
Limbaj PostScript (".ps")
Limbaj de programare creat de Adobe care cuprinde 420 de operatori de format de comanda care controleaza structura generala, imprimarea (dar nu afisarea pe ecran). Permite imprimarea formatata pe orice fel de imprimanta incepand de la orice platforma (Windows, UNIX, etc.). Formatul EPS (Encapsulated PostScript, "eps") este un sub-program cuprins in fisierele PostScript, utilizat in mod obisnuit pentru imaginile produse cu un program, altul decat PostScript.
Format PDF: Portable document Format (format de documente transferabile) (."pdf")
Alta dezvoltare a lui Adobe, formatul PDF utilizat exclusiv pentru toate programele Acrobat pentru a fi creat, editat, vizualizat, etc. El este independent de dispozitivul de imprimare si sustine editarea electronica utilizand o formatare si grafice complexe, inclusiv legaturi incorporate, adnotari, schite de pagini si marile linii de capitole pentru acces direct. Adobe a aratat intentia sa de a integra structura astfel incat dispunerea in format PDF sa se extinda pentru a ingloba limbajul SGML.
formate de documente structurate
Comparat cu limbajele de descriere de pagina, limbajele structurate de marcare a informatiei descriu informatiile (continutul) si structura, si nu dispunerea. Acestea sunt instrumente utilizate si platforme de tratare independente care faciliteaza indexarea automata descriind anteturi, capitolele, paragrafele, notele de subsol, etc.
Limbajul SGML: Standard Generalized mark-Up (ISO norma 8879-1986)
Un metalimbaj normalizat, sau sintaxa, conceputa pentru specificarea unui numar nelimitat de limbaje de marcare. Un document in limbaj SGML comporta trei elemente: declaratia (descrie mediul de tratare cerut); definirea tipului de document (DTD) (o trimitere definita care formeaza un gabarit pentru descrierea structurii si a continutului unui tip special de document); si in continuare documentul propriu-zis. Limbajul SGML este independent de orice sistem, aparat, limbaj sau aplicatie si, pentru ca separa definirea continutului unui document al prezentarii, el permite un acces sau o prezentare a informatiilor care nu erau previzibile in momentul marcajului.
Limbajul HTML: Hypertext Mark-up Language (".htm", ".html")
Este o aplicatie SGML, prin urmare sintaxa documentelor HTML este corespunzatoare normelor definite prin combinarea Declaratiei SGML si prin definirea DTD. HTML permite generarea de documente multimedia. Numeroasele variante HTML[3] au determinat intr-o mare masura ameliorarea prezentarii paginilor Web prin imbunatatirea suportului de documente multimedia, prin posibilitatea interpretarii limbajului de programare de catre navigator, prin cresterea numarului de tag-uri utilizate. Foloseste mai multe seturi de metadate in functie de aplicatie, de particularitatea documentului.
Limbajul DHTML: Dynamic HTML (limbaj HTML dinamic)
Denota dezvoltarile recente realizate de Netscape si Microsoft si care utilizeaza un ansamblu de pagini de stil in cascada (a se vedea mai departe) si un limbaj de scriere in cod masina ca limbajul de scriere Visual basic si Javascript pentru a fuziona documentul HTML cu pagina de stil. Permite un mai mare control creator asupra prezentarii vizuale a unei pagini HTML si permite paginii sa reactioneze in mod dinamic, fara un apel la server, pentru evenimentele produse de utilizatori.
Limbajul XML: Extensible Mark-up Language (".xml")Prezentarea XML
XML (a se intelege eXtensible Markup Language si a se traduce Limbaj reper extins sau Limbaj reper extensibil) este intr-o oarecare masura HTML imbunatatit care permite definirea noilor balize. Este vorba efectiv de un limbaj care permite punerea in format a documentelor gratie reperelor (markup).
Contrar HTML, care trebuie considerat ca un limbaj definit si fix (cu un numar de repere limitat), XML poate fi considerat un metalimbaj care permite definirea altor limbaje, adica definirea unor noi repere care permit descrierea prezentarii unui text.
Forta XML consta in capacitatea sa de a putea descrie orice domeniu de date gratie extensibilitatii sale. Acesta va permite structurarea, scrierea vocabularului si a sintaxei datelor pe care le va contine.
In realitate, reperele XML descriu mai degraba continutul decat prezentarea (contrar HTML). Astfel, XML permite separarea continutului de prezentare ceea ce permite de exemplu afisarea aceluiasi document pe aplicatii sau periferice diferite fara a fi nevoie totusi de crearea tot atator versiuni ale documentului de cate reprezentari este nevoie!
XML a fost finalizat de XML Working Group sub egida World Wide Web Consortium (W3C) inca din 1996. din 10 februarie 1998, specificatiile XML 1.0 au fost recunoscute ca recomandari de catre W3C, lucru care-l transforma intr-un limbaj recunoscut. (Toate documentele legate de norma XML pot fi consultate si descarcate de pe site-ul web al W3C, https://www.w3c.org/XML/)
XML este un subansamblu de SGML (Standard Generalized Markup Language), definit prin standardul ISO8879 in 1986, utilizat in mediul Gestionarii Electronice Documentare (GED). XML reia cea mai mare parte din functionalitatile SGML, fiind vorba deci, de o simplificare a SGML pentru a-l face utilizabil pe web!
Punerea in pagina a XML
XML este un format de descriere a datelor, si nu de reprezentare a lor, cum este in cazul HTML. Punerea in pagina a datelor este asigurata de un tert limbaj de punere in pagina. In prezent (finele anului 2000) exista trei solutii de punere in format a unui document XML:
CSS (Cascading StyleSheet), solutia cea utilizata in prezent, dat fiind faptul ca este vorba de un standard care s-a dovedit deja util cu HTML
XSL (eXtensible StyleSheet Language), un limbaj de foi de stil extensibil dezvoltat in special pentru XML. Totusi, acest nou limbaj nu este recunoscut momentan ca un standard oficial.
XSLT (eXtensible StyleSheet Language Transformation). Este vorba de o recomandare W3C din 16 noiembrie 1999, care permite transformarea unui document XML in document HTML insotit de foi de stil.
Structura documentelor XML
XML furnizeaza un mijloc de verificare a sintaxei unui document gratie DTD (Document Type Definition). Este vorba de un fisier care descrie structura documentelor care se refera la acesta gratie unui limbaj adaptat. Astfel, un document XML trebuie sa urmareasca cu scrupulozitate conventiile de notare XML si se poate referi eventual la un DTD care descrie intrepatruderea elementelor posibile. Un document care urmareste regulile XML se numeste document bine format. Un document XML care poseda un DTD si care este conform cu acesta se numeste document valid.
Decodarea unui document XML
XML permite deci definirea unui format de schimb in functie de nevoile utilizatorului si de oferta mecanismelor pentru verificarea validitatii documentului rezultat. Este deci esential pentru cel care primeste un document XML sa poata extrage datele din document. Aceasta operatiune este posibila cu ajutorul unui instrument numit analizator (in engleza parser, deseori preluat in franceza ca parseur).
Analizatorul permite pe de o parte extragerea datelor dintr-un document XML (se vorbeste de analiza documentului sau de parsing) precum si de eventuala validitate a documentului.
Avantajele XML
Iata principalele atuuri ale XML:
o Lizibilitatea: teoretic, nu trebuie sa ai vreo cunostinta pentru a intelege continutul unui document XML
Astfel, XML este in special adaptat la schimbul de date si de documente
Interesul de a dispune de un format comun de schimb de informare depinde de contextul profesional in care intervin utilizatorii. Tocmai de aceea numeroase formate de date rezultate din XML apar (sunt din acestea mai mult de o suta):
OFX: Open Financial eXchange pentru schimburile de informatii in lumea financiara
MathML: Mathematical Markup Language permite reprezentarea unor formule matematice
CML: Chemical Markup Language permite descrierea compusilor chimici
SMIL: Sychronised Multimedia Integration Language permite crearea unor prezentari multimedia sincronizand diverse surse: audio, video, text,
Este o alta aplicatie SGML axata pe redarea continutului paginilor Web. XML urmareste identificarea si redarea unitatilor informationale din continutul documentelor. La fel ca si SGML, permite separarea continutului de forma de prezentare, foloseste DTD pentru validare dar in schimb are o alta sintaxa mult mai flexibila in programare. Documentele XML pot contine metadate definite in acord cu RDF.
XML intentioneaza sa completeze sau sa inlocuiasca HTML dar documentele XML sunt in majoritatea lor documente text.
ODA - Office Document Arhitecture[4] a fost adoptat ca standard in 1989 (ISO-8613). A fost conceput pentru schimbul "orb" de documente adica schimbul fara stabilirea in prealabil a unor legaturi intre expeditor si destinatar. Este folosit pentru documente structurate dar inglobeaza si documente multimedia. Nu foloseste secvente de caractere sau balize dar exista un mod de codificare. Este un format strict ce stabileste legaturi intre structura fizica si structura logica a documentului. Integreaza si continut non-textual.
Hy Time - Hypermedia Time -based Document Structuring Language[5] este o extensie compatibila cu SGML. A fost adoptat ca standard in 1994 (ISO 10744). Este destinat a reprezenta documente hypertextuale si multimedia (componente temporale in special). Hy Time utilizeaza principiile de marca descriptiva si DTD pentru descrierea de documente hypermedia integrand dimensiunea temporala. Continutul este redat ierarhic si nu prin codificare. Standardul exprima legaturile hypertext ale documentelor SGML; portiuni de informatie continute de diferite elemente. Hy Time este definit prin forme arhitecturale ce sunt elemente descrise in acord cu sintaxa SGML. Formele arhitecturale sunt grupate in module ce permit stabilirea de interconexiuni hypermedia si descrierea relatiilor ce se stabilesc intre elementele multimedia. Un document Hy Time este de fapt o componenta particulara a unui document SGML.
formate de imagini fixe si animate
Imagini fixe: Formate adresabile pe bit
Aceste formate inregistreaza informatii pe pixeli sau punctele speciale. Ele sunt in mod obisnuit destinate memorarii, deci au tendinta sa fie utilizate pentru imaginile simple.
Format GIF: Graphics Interchange Format (".gif")
Format de imagine foarte utilizat care permite o buna afisare pe majoritatea sistemelor informatice, dar este limitat la 256 de culori. El utilizeaza o tehnica de compresie fara pierdere. El face disponibile fisiere relativ mici pentru afisarea imediata cu texte in documentele Web, este deci utilizat in mod curent pentru barele de instrument, iconite si imagini integrate. El poate fi "impletit' (orice imagine este afisata cu claritate in locul unei afisari secventiale linie cu linie). O culoare poate fi transparenta (potrivita imaginilor/icoanelor miscatoare pe fondurile de ecran)
JPEG: Joint Photographics Expert Group (".jpg"). Format de compresie cu calitate controlata. Mai mult de 16 milioane de tonuri de culoare sunt disponibile. Se potriveste mai bine decat formatul GIF pentru imaginile reale cum ar fi fotografiile color.
TIFF: Tagged-Image File Format (format de eticheta de fisier video) (".tif" sau "tiff")
Inmagazineaza o foarte mare cantitate de informatii fata de o imagine. Sustine diferite tipuri de compresie (cu calitate controlata si fara pierdere). Foarte utilizat, dar este in principal un format intermediar.
PNG: Portable Network Graphics (grafice de retele portabile) (".png"; pronuntat "ping")
Urmareste sa inlocuiasca formatul GIF si comporta imbunatatiri la nivelul detectarii de eroare si a vitezei de impletire, cat si un procent de compresie mai mare. Format in aparitie dar nu foarte utilizat inca.
Imagini fixe: Formate vectoriale
Aceste formate sunt utilizate pentru a inmagazina informatie (algoritmi matematici) despre liniile si curbele care compun imaginea. Utilizat pentru documentele disparate (de exemplu, documentele care combina textele formatate intr-o maniera complexa, imaginile, etc.). Schimb usor de scara pentru a afisa diferitele niveluri de marire. PostScript si PDF utilizeaza imaginea vectoriala.
CGM: Computer Graphics metafile (metafisier de imagini grafice informatice)
Norma pentru memorarea si schimbul de date grafice cu doua dimensiuni. La plecare era un format vectorial, dar a fost largit recent pentru a cuprinde capacitatile de memorie. Patru norme internationale au fost elaborate si precizeaza modalitatea in care CGM trebuie sa fie utilizat in postele electronice cu extensie MIME si pe web.
formate multimedia/interactive
ShockWave
Produsul multimedia Macromedia sustine jocurile, interfetele de animare, semnele interactive, demonstratiile si o iesire audio de calitate compact disc. Cuprins in Netscape Navigator si Microsoft Explorer.
Java, Active X
Una din functiile limbajului de programare Java, de la Sun Microsystem sau Active X de la Microsoft, este de a sustine transmisia in continuu a datelor multimedia cu multi-ferestre. Microsoft si Netscape au integrat cele doua tehnologii in navigatorii lor.
Identificare si localizare
URI: Uniform Resource Identifier
Termen care include toate tehnologiile - cuprinde in prezent URL, URC si URN dar este extensibil - a fost conceput sub auspiciile Grupului IETF, pentru a numi, adresa si, pana la un anumit punct, a descrie resursele Web.
https://www.ics.uci.edu/pub/ietf/uri
URL: Adresa URL (localizator de resurse uniforme)
Adresa electronica care precizeaza (in ordine): protocolul de comunicare, domeniul/serverul gazda, drumul repertoriului, numele fisierului si tipul de fisier. Daca una sau alta din aceste date se schimba (situare, metoda de acces sau nume), legatura este intrerupta daca nu exista cel putin o pagina care sa lege utilizatorul de noua amplasare; adresa URL devine atunci un PURL. Origine: 1994 de W3C.
URN: Uniform Resource Name
Conceput de IETF pentru a raspunde nevoilor unui identificator general, persistent si unic pentru o resursa electronica (prin opozitie cu un URL, care, desi are in prezent o functie de identificare, este legat de amplasarea resursei, care poate fi multipla si se poate schimba in orice moment). Necesita registre URN (pentru a veghea sa nu existe nici o dedublare) si sisteme de rezolutie (pentru a stabili o corespondenta cu situarea sau situarile resursei). https://www.ietf.org/html.charters/urn-charter.html
ISBN, ISSN, ISMN
Identificatori bibliografici standard pentru documentele imprimate care pot fi atribuiti cartilor electronice, publicatiilor in serie si muzicii.
SICI: Serial item and Contribution Identifier (identificator de articole si de contributii la publicatii in serie) (Ansi/NISO Z 39.56 - 1996, vers. 2)
Pe cale de elaborare pentru a identifica problemele referitoare la publicatiile in serie si doar articolele fara referire la suportul de difuzare (hartie, electronic, microformat). Nu este inca utilizat.
https://sunsite.berkeley.edu/SICI/
DOI: Digital Object Identifier (identificator de obiecte electronice)
Este pe cale de elaborare de catre Association of American Publishers si Corporation for National Research Initiatives (CNRI) pentru a identifica obiectele numerice care ar putea fi carti, capitole, articole, imagini, inregistrari, video sau orice alta opera de creatie, in principal in scopuri de gestionare eficace a drepturilor si a comertului numeric. Se aseamana putin cu ISBN in formularea sa: o componenta la stanga barei oblice denota prefixul deponentului, si o componenta la dreapta barei este identificatorul unic al obiectului, asa cum a fost desemnat de deponent.
PURL: Persistent Uniform Ressource Locator (localizator persistent de resurse uniforme)
O apropriere de problema permanentei adresei URL propusa de OCLC. PURL este un alias public pentru un document. El ramane stabil, in timp ce fondul documentului URL se schimba conform gestionarii (de exemplu, deplasarea care este facuta).
Identificare de continut. Metadate
Metadatele sunt date despre date ce ajuta la identificarea, descrierea si localizarea resurselor din retea. ADBD si implicit lumea documentara pe care o reprezinta, considera metadatele: "informatie secundara referitoare la o sursa electronica"[6]
Exista mai multe tipuri, mai multe modele de metadate[7] corespunzatoare cu diferite nivele de organizare a resurselor, cu necesitatea de a face sa coexiste aplicatii documentare clasice cu aplicatiile Web.
ISBD, RCAA2, LC, CDD, LCSH, MARC, etc.
Norme traditionale de biblioteci pentru descrierea de resurse biblioteconomice conventionale care pot fi utilizate pentru resursele electronice.
Eticheta 856 din US MARC permite furnizarea URL-ului in notitele bibliografice.
CIMI (Consortium for the Computer Interchange of Museum Information) standard elaborat pornind de la Dublin Core https://www.cimi.org. Actori la origine: Asociatia de muzee din America de Nord
Finalitate: prezervarea si schimbul informatiilor tratate de catre muzee sub forma numerica.
Conceput in Statele Unite si adoptat acum in alte tari, GILS este o colectie descentralizata de sisteme care contin baze de date din fisierele GILS care ofera informatii privind amplasarea si accesul la informatii privind resursele guvernamentale la dispozitia publicului.
TEI Headers: (antete ale initiativei de codificare de text)
Antetele documentelor TEI (un limbaj SGML, definire de tip de document), in mod obisnuit resurse erudite cum ar fi proza, versurile, piesele de teatru, dictionarele, care descriu fisierul (mentiunea titlului, instruire privind publicatia, descrierea sursei), codificarea sa, informatii privind actualizarile.
EAD: Encoded Archival Description (descriere codificata de arhive). Un limbaj SGML, definirea tipului de document ca instrument de cercetare a fondurilor de arhive.
DUBLIN CORE -un set initial de treisprezece metadate, (acum sunt cincisprezece) menite sa descrie intr-o maniera suficient de simpla pentru creator, documente Web astfel incat acestea sa poata fi localizate in retea. Elementele Dublin Core
Fiecare element constituie o referinta in descriere, reda un anumit aspect, o fateta a documentului. Tinand cont de aspectele pe care le exprima si de relatiile care se pot stabili intre elemente, acestea pot fi grupate in urmatoarele trei seturi:
PICS: Platform for Internet Content Selection (platforma de selectie a continutului pe Internet)
Un grup de lucru W3C (World Wide Web Consortium) a propus un ansamblu de etichete de metadate pentru a sprijini auto-descrierea de o terta parte, cat si evaluarea continutului de documente si de resurse electronice. Scopul este de a permite utilizatorilor de Internet sa aleaga resurse bazate eficace pe aceasta descriere de metadate, care va fi alipita resurselor.
Pare stabilit din 1998. https://www.w3.org/PICS/
DIctionnaire de l'Information /Directeur du Comité de redaction Serge Cacaly ; Comité de redaction Yves- François Le Coadic, Paul-Dominique Pomart, Eric Sutter . - 2- ème édition . - Paris : Armand Colin, 2004 .
Prelucrare dupa:,Ghislaine Chartron. Standards - Normes - Documents numériques. Introduction générale. https://www.ccr.jussieu.fr/urfist/presse/standard/coursintro.htm
Yves Marcoux. Martin Sevigny. Why SGML? Why Now? In: Journal of The American Society for Informatrion Science. Vol. 48, nr. 7, 1997, p.588-590.
"Les metadonnes ne sont qu'information secondaire relative a une ressource electronique". Journee d'etude organisee par l'ADBS, 2 fevrier 1999. Http://www.adbs.fr/adbs/prodserv/jetude/html/pro0202a.htm
Diferite comunitati stiintifice, tehnice au propus (si utilizeaza) variante de metadate in functie de domeniul lor specific de interes. Asemenea metadate au preluat elemente din regulile clasice de catalogare (ISBD; AACR2) si din formatul MARC (inclusiv din numeroasele sale variante). Un exemplu de metadate pentru un domeniu specific ar fi: Content Standard for Digital Geospatial Metadata (CSDGM) produs de Federal Geografic Data Committee (FGDC).
Copyright © 2025 - Toate drepturile rezervate