Biologie | Chimie | Didactica | Fizica | Geografie | Informatica | |
Istorie | Literatura | Matematica | Psihologie |
Hipertext, documente interactive
si standarde de documente
1. Definitie si scurt istoric[2][9][10]
In terminologia informaticǎ termenul de hipertext desemneazǎ o paradigmǎ de interfatǎ cu utilizatorul pentru vizionarea documentelor interactive, care pot executa anumite functii la cererea acestuia. Hipertextul este o modalitate de organizare a materialului care incearcǎ sǎ depǎseascǎ limitǎrile inerente ale textului traditional, in particular linearitatea acestuia. In limba greacǎ prefixul hyper- (a fi dincolo de) semnifica aceasta calitate a hipertextului, de a trece dincolo de text.
Cea mai uzula formǎ a documentelor de tip hypertext contine legǎturi cǎtre alte astfel de documente, denumite hiperlegaturi (hyperlink). Prin selactarea unei astfel de lagǎturi de cǎtre utilizator sistemul de calcul executǎ instructiunile necesare afisǎrii documentului referentiat prin aceastǎ legǎturǎ.
Un document he tip hip poate fi static (pregǎtit si stocat in avans) sau generat in mod dinamic (prin actiunile utilizatorului). De aceea toate formele avansate de hipertext pot incorpora alte paradigme de interfatǎ, de exemplu meniuri sau linii de comandǎ, si pot fi utilizate pentru a accesa atat colectii statice de date, cat si aplicatii interactive. Documentele si aplicatiile pot fi locale sau distribuite, fiind accesibile prin intermediul retelelor locale si a internetului. Cea mai faimoasǎ inplementare a mediului de tip hipertext este WWW (World Wide Web).
In ultima perioadǎ au aparut aplicatii extrem de complexe ale hipertextului, care contin importante componente multimedia. Un termen mai potrivit pentru a le desemna ar fi hipermedia.
Primele forme rudimentare care au precedat hipertextul au fost modelele de scriere a lucrarilor literare referentiate (dictionare, enciclopedii, bibliografii etc.) in care apareau mici etichete scrise cu majuscule indicand existenta unui articol sau unei lucrǎri referitoare la subiectul respectiv.
Principala problemǎ pe care trebuie sǎ o rezolve hipertextul este supraincǎrcarea informationala, una dintre problemele cele mai stringente ale lumii moderne. Primele solutii ale acestei probleme au fost propuse de diversi oameni de stiinǎ incǎ de la inceputul secolului XX. Paul Otlet a propus ca documentele sǎ fie descompuse in fraze individuale care sa fie inscrise pe cartele iar H.G. Wells a descris intr-una din lucrǎrile sale un "creier universal".
Actul de nastere al hipertextului este
celebrul articol al lui Vannevar Bush intitulat "As We May Think" ("Cum am
putea gandi"), publicat in revista
ZOG,
primul sistem hipertext operational a fost dezvoltat la sfarsitul
anilor '70 la universitatea Carnegie Mellon si a fost implementat in 1980
pe portavionul USS Carl Vinson sub denumirea de Knowledge Management System (Sistem
de Gestionare a Informatiilor). Prima aplicatie hipermedia a fost o
panorama a orasului
Anii '80 au marcat o dezvoltare rapidǎ a programelor experimentale de tip hipertext si hipermedia insǎ acestea nu au ajuns sǎ fie cunoscute de marele public. Primul dintre aceste sisteme a fost Guide, dezvoltat initial pentru statiile de lucru care foloseau sistemul de operare UNIX, fiind ulterior portat pe sistemul DOS. Principalele dezavantaje ale acestui sistem erau cerintele foarte mari pentru epoca respectivǎ, pretul ridicat si utilizarea greoaie.
In august 1987, la conventia MacWorld, Apple a prezentat pentru prima data propriul sǎu sistem numit HyperCard, destinat sistemelor de calcul Macintosh. Acesta a avut succes imediat si a popularizat conceptul de hipertext printre utilizatori. In acelasi an a avut loc prima conferintǎ pe tema hipertextului.
In
1980 Tim Berners-Lee, cercetǎtor la prestigiosul institute CERN a creat ENQUIRE,
primul sistem hipertext capabil sǎ lucreze cu
baze de date. Tot el a creat sistemul WWW (World Wide Web) pentru a
facilita comunicarea si schimbul de informatii intre
cercetǎtorii universitǎtilor din intreaga lume. In 1993 Centrul
National de Aplicatii pentru Supercalculatoare (NCSA) de la
univesitatea din
X Window si oferea o interfatǎ prietenoasǎ, capabilǎ sǎ afiseze text, imagini si hiperlegǎturi si incorpora protocoale cum ar fi Gopher. Dupǎ lansarea de browsere pentru PC si Macintosh reteaua e evoluat rapid de la circa 500 de servere in 1993 la cateva milioane astazi si a inlocuit practice toate celelalte sisteme hipertext.
2. Structura unui document hipertext. Limbaje de marcaj
Documentele de tip hipertext sunt scrise folosind limbaje speciale numite limbaje de marcare (markup language). Numele derivǎ din practica autorilor de a adǎuga marcaje pe marginile manuscriselor inainte de a le trimite la tipǎrit Un astfel de limbaj combina textul si informatii despre formatul acestuia, structurate sub forma unor marcaje intercalate in corpul textului. La inceput aceste limbaje au fost utilizate in industria tipograficǎ ca limbaj descriptiv pentru imprimante.Cele mai folosite limbaje sunt HTML si extensia acestuia, XHTML. In ultima vreme a inceput sǎ fie folosit din ce in ce mai mult limbajul XML. Limbajele de marcaj se impart dupǎ structura si utilitatea lor in trei categorii: de prezentare, procedurale si descriptive.
Limbaje de prezentare se utilizeazǎ pentru a defini structura documentului pe baza cozilor de codare. De exemplu intr-un un fisier text titlul poate fi precedat de cateva linii goale si spatii, care sugereazǎ faptul cǎ acesta este centrat. Acest limbaj este apropiat de cele folosite de editoarele de text.
Limbaje procedurale - sunt de asemenea destinate formatǎrii textului, dar marcajele sunt de obicei vizibile utilizatorului care editeazǎ fisierul. Aceste marcaje sunt interpretate de cǎtre soft in ordinea in care apar. De exemplu ca un cuvant sǎ aparǎ cu un anumit format acesta va fi precedat de etichete cu semnificatiile respective si succedat de etichetele inverse. Programele interpretoare folosesc un mecanism destul de complicat de tip stivǎ, sau macrouri. Cele mai multe limbaje procedurale contin o implementare a unui limbaj de programare Turing complet (capabil sǎ simuleze o masina Turing universalǎ). Un limbaj de acest tip este PostScript, folosit la crearea documentelor de tip .pdf.
Limbaje descriptive - mai sunt numite si semantice datoritǎ faptului cǎ se aplicǎ etichete fragmenteleor de text care nu specificǎ neapǎrat un mod de afisare sau o prelucrare semanticǎ de altǎ naturǎ. De exemplu limbajul Atom (variantǎ de XML) cuprinde marcaje care precizeazǎ cand a fost actualizatǎ pentru ultima datǎ informatia, fǎrǎ a cuprinde directive specifice de afisare. Standardele SGML si XML sunt destinate in mod specific dezvoltǎrii de limbaje descriptive.
Intr-un sistem practic se regasesc de obicei mai multe tipuri de limbaje de marcaj. De exemplu HTML contine elemente de marcaj de tip procedural, cum ar fi [b] [/b](bold) in timp ce altele sunt descriptive, cum ar fi blockquote sau href=. Instrumentele si seturile de reguli pentru marcaj sunt dezvoltate de institutii specializate Un altfel de sistem a fost CALS, utilizat pentru redactarea manualelor electronice pentru industrie si fortele armate. Principalul avantaj era cǎ dupǎ aceste documente se puteau produce extrem de usor variante tipǎrite. Acest sistem a fost succedat de SGML. In prezent au apǎrut o largǎ limbaje de marcaj dintre care cele mai importante sunt DocBook, OpenBook XBRL.
Majoritatea sistemelor moderne de marcaj descritiv structureazǎ documentele in structuri ierarhice arborescente, dar unele au si referinte in cadrul aceluiasi nivel. Din acest motiv ele pot fi mai corect caracterizate drept baze de date semi-structurate. Nu toate documentele pot fi reprezentate printr-o structura de acest tip, majoritatea lucrǎrilor lirice sau de beletristica avand structuri mult mai putin regulate. Pentru astfel de documente au apǎrut sisteme specializate, cum ar fi MECS, LMNL si CLIX.
Principala calitate a marcajului descriptiv este flexibilitatea acestuia. Dacǎ fragmentele de text sunt etichetate asa cum sunt si nu asa cum ar trebui afisate se lasǎ deschisǎ posibilitatea ca pe viitor sa se poatǎ scrie programe care sǎ le proceseze intr-un mod diferit. De exemplu hiperlegǎturile HTML, prevǎzute initial pentru a fi accesate de utilizatorii umani sunt astǎzi folosite de motoarele de cautare pentru a-si actualiza baza de date.
Cel mai general limbaj de marcare este SGML (Standard Generalised Markup Language), care la randul sǎu a derivat din GML, dezvoltat de IBM la sfarsitul anilor '60. Acest limbaj contine o varietate de sintaxe de marcaj folosite pentru diverse aplicatii si este descri de standardul ISO 8879:1986. De-a lungul timpului au apǎrut mai multe limbaje derivate din acesta:
HTML (HyperText Markup Language) - a fost conceput initial (v1.0) pentru a simplifica sintaxa destul de riguroasa a HTML-ului. A fost apoi reformulat (v2.0) ca o aplicatie a SGML.
XML (Extensible Markup Language) - este derivat direct din SGML si acoperǎ un spectru larg de aplicatii. XML este un subset specific, mai simplu, de reguli SGML si este utilizat pentru aplicatii de uz general, cum ar fi XHTML, RSS, Atom si SOAP.
DocBook - a fost initial conceput pentru elaborarea documentatiilor tehnice, ulterior fiind incorporat in XML ca aplicatie.
4. Limbajul XML[5][3][9]
In ultima vreme toata lumea vorbeste despre XML.
Cei mai multi isi imagineaza o moda tehnologica care se refera exclusiv la Internet si ca, daca nu lucreaza in acest domeniu, subiectul nu-i priveste decat, cel mult, sub aspectul culturii generale.
Nu este insa asa. XML este o filozofie care are sanse reale sa schimbe complet fata informaticii. O alta impresie, gresita si ea, este ca XML este un fel de HTML, mai puternic si mai complicat. HTML este extrem de popular, asa incat o astfel de abordare a limbajului XML este foarte tentanta.
Dar, din pacate, fundamental gresita, deoarece HTML nu este genul proxim pentru XML. Daca HTML este un limbaj de marcare care a fost conceput pentru a permite afisarea de catre un navigator Web a unui document, XML este un limbaj a carui rol este de a defini alte limbaje de marcare. Altfel spus, XML este un metalimbaj.
Mult mai simplu (si mai corect) este sa spunem ca XML este un soi de SGML simplificat. Dezavantajul acestei abordari este faptul ca foarte putina lume a avut de-a face cu SGML.Descendent al SGML, XML este un metalimbaj utilizat in activitatea de marcare structuralǎ a documentelor.Caracteristicile care fac din XML un format folosit de pǎstrare a datelor sunt:
- usurinta dea fi transformat in alte formate finale cu destinatii concrete;
- independenta fatǎ de formatele proprietare.
Scopurile limbajului au fost cele legate de utilizarea lui in Internet, suportand o varietate de aplicatii, dar pastrand compatibilitatea cu SGML.XML trebuie sǎ asigure o prelucrare facilǎ a documentelor, in termeni concisi si clari numarul de optiuni facultative fiind redus la minim, ideal nul.XML este compus dintr-o familie de limbaje menite a adopta conceptele curente de publicare a documentelor pe Internet.
4.1. Caracteristici XML
- Subset simplificat al SGML.Foarte puternic, dar usor de implementat.
- Fǎrǎ limite in ceea ce priveste complexitatea structurilor care pot fi definite
- Indeajuns de compact pentru a putea fi suportat de navigatoarele Web.
- Oferǎ suport pentru uzul international
- Marcajele si continutul pot fi reprezentate in Unicode
- Uneltele de dezvoltare XML pot suporta orice codificari.
- Metalimbaj
- Conceput pentru a suporta definirea unui numar nelimitat de limbaje specializate, oferind suport de extinderi.
- Portabilitate.
4.2 Componentele XML
XML este bazat pe conceptul documentelor create dintr-o serie de entitǎti, obiecte. Fiecare obiect contine unul sau mai multe elemente logice - fiecare cu anumite proprietǎti, atribute ce pot definiti modul in care se va face procesarea acestuia.
XML pune la dispozitie o sintaxǎ formalǎ pentru descrierea relatiei dintre entitǎti, elemente si atribute ce alcǎtuiesc un document XML - care spune computerului cum sǎ recunoascǎ partile componente ale fiecǎrui document.
XML diferǎ de alte limbaje markup prin aceea cǎ nu doar indicǎ momentul in care se produce o schimbare sau apare un element nou. Acesta stabileste frontierele dintre evenimentele componente ale unui document chiar dacǎ acestea reprezintǎ inceputul unui nou capitol, o referintǎ, etc.
Pentru a permite ca computerul sǎ verifice structura unui document, utilizatorii trebuie sǎ-i asigure definirea tipului de document care contine una dintre entitǎtile, elementele sau atributele componente si relatiile dintre ele.
4.3 Utilizarea XML
Pentru a utiliza un set de marcaje anterior definit utilizatorul trebuie sǎ stie in ce mod marcajele sunt delimitate fatǎ de textul obisnuit si in ce ordine trebuie utilizate elementele. Sistemele ce folosesc XML pot sǎ la asigure userilor liste de elemente disponibile la orice moment si care adaugǎ marcaje automat in text. Elementele sau atributele pot fi adǎugate si de user intre semnele "<" ">". Referintele la entitǎti incep cu & si sunt intre paranteze (& . ..). Deoarece seturile de marcaje XML sunt bazate pe structura logicǎ a documentelor sunt mai usor de inteles decat schemele fizice de marcaje. Un exemplu de XML este urmatorul:
<to>All staff</to>
<from>Martin Brian</from>
<date>5th November</date>
<subject>Cats and Dogs</subject>
<text>bla bla bla</text>
</memo>
Formatul neutru asigurat de XML dǎ posibilitatea utilizatorului de a alege modul de afisare pe ecran, mǎrimea cǎrui obiect sǎ fie variatǎ, sǎ genereze o formǎ complet nouǎ pozitionand fiecare element acolo unde el este necesar.
Utilizarea HTML in cadrul XML
- definirea propriilor seturi de instructiuni
- definirea atributelor instructiunilor
- incorporarea elelementelor de text standard si non-standard
4.4 Deosebiri esentiale fatǎ de SGML
Orice document XML trebuie sǎ inceapǎ cu meta-elementul <?xml . >.In XML nu trebuiesc realizate definitii ale tipului de document(DTD) obligatorii. Un element vid (declarat prin EMPTY) are o sintaxǎ modificatǎ: <element />. Tagurile de sfarsit sunt obligatorii. Numele de elemente si de atribute sunt case-sensitive ( <tag> este diferit de <Tag> sau <TAG>
In XML pot fi specificate anumite instructiuni de procesare de forma <?nume informatii ?>, unde nume, denumit tintǎ, indentificǎ instructiunile de procesare pentru o aplicatie Incluziunile si excluziunile nu sunt permise, la fel parametrii de minimizare in declaratiile de elemente.
Numele incepand cu XML sau xml sunt rezervate.
Bibliografia?
Bibliografie
1. Markup systems and the future of scholarly text processing by James H. Coombs, Allen H. Renear, and Steven J. DeRose.
Reid,
Brian. 'Scribe: A Document Specification Language and its Compiler.' Ph.D. thesis,
DeRose,
Steven J. 'The SGML FAQ Book.'
https://www.w3.org/TR/2004/REC-xml11-20040204/ Extensible Markup Language (XML)
5.
XML Contracts'.
. Raggett, Dave (1998). Raggett on HTML 4 Addison-Wesley, chap. 2: A history of HTML. ISBN 0-201-17805-2
7. Bolter, Jay David (2001). Writing
Space: Computers, Hypertext, and the Remediation of Print.
8. Byers, T. J. (April 1987). 'Built by association'. PC World
9. Cicconi, Sergio (1999). ''Hypertextuality''. Mediapolis. Ed. Sam Inkinen. Berlino & New York: De Gruyter.
10. Crane, Gregory (1988). 'Extending the boundaries of instruction and research'. T.H.E. Journal (Technological Horizons in Education) (Macintosh Special Issue): 51-54.
Copyright © 2024 - Toate drepturile rezervate