Ref 20131221_ADP rev 20160713
File cmp-prg-txt html
ID computer programma - text
howto
terug

Computer programma - text

Tekstverwerker

Een tekstverwerker is een computerprogramma.
Dit is in princie wat je doet wanneer je een tekstverwerker gebruikt.

Nu een beetje grondiger.

Wanneer je een tekst schrijft, wordt die op het computerscherm getoond.
Wanneer je de tekst "opslaat", wordt die tekst als een bestand bewaard.
Een bestand is in dit geval, een groep tekens (de letters) die we in één keer onder één naam kunnen bewaren, en ook weer terughalen.
De manier waarop de groep tekens (de letters) worden opgeslagen, worden bepaald door de bestandsextensie.

Een bestandsnaam bestaat uit twee delen, gescheiden door een "punt", bijvoorbeeld   bestandsnaam.extensie 

Voorbeelden van bestanden:

Voorbeeld van een bestandsnaam
Extensie
Inhoud
Formattering
ISO-certifiëring
Platte-tekst.txt
.txt
platte tekst
neen
ja
Rich-Text-formaat.rtf
.rtf
"Rich Text"
ja
neen
Microsoft-97-2000-2003
document.doc
.doc
binair bestand
ja
neen
Microsoft-2007-2010-2013-365-Online document.docx
.docx
ZIP met daarin XML-bestanden
ja
neen
Open-document.odt
.odt
binair bestand
ja
ja
webpagina.html
.html
platte tekst
ja
ja

Beetje uitleg:


Detail



Wanneer we bijvoorbeeld een tekstje zoals dit zouden schrijven met verschillende tekstverwerkers, en we "kijken" in de computer hoe die tekst er op de schijf uit ziet, zien we merkwaardige verschillen.

De alinea hierboven is 203 letters lang.

Platte tekst


Wanneer we die in een "platte-tekst-bestand" wegschrijven, zien we dit staan:



Perfect leesbaar, maar geen enkel tekst-attribuut is aanwezig.

In een platte tekst kan je wel heel erg lange lijnen maken. Neem een platte-tekstbestand met bvb het getal π (pi) tot op 25000 decimalen, dan bevat dit bestand één enkele lange lijn  omdat één enkel getal is. Wanneer je die bekijkt met een editor, (zonder "automatische terugloop") dan zie je echt één enkele heel erg lange lijn, in dit voorbeeld 25000 cijfers lang. Deze éne lijn kan je alleen zien bij echte tekst-editors (zoals in dit voorbeeld). Dit kan je nooit zien met een grote tekstverwerker, omdat die pagina-gebonden is. Daar wordt die ene lijn verknipt om binnen de pagina-randen te passen.

    

Wanneer je de automatische terugloop inschakelt, wordt de éne lijn wel verdeeld over de breedte van het venster.
Dit lukt bij alle editors en tekstverwerkers.




HTML-tekst


Doen we hetzelfde met een html-tekst, dan zien we dit:
Proeftekst-html bij het opstellen van de tekst:



Proeftekst-html bij het bekijken van de tekst met een browser:



Proeftekst-html bekijken met een platte-tekst-editor:



Proeftekst-html, bekeken met een "pro" tekst-editor:



Dezelfde proeftekst-html, maar bekeken met een hex-editor: (alleen het eerst deel)



Grote tekstverwerker

Nu het grote werk.

We nemen dezelfde alinea (203 letters), en voeren die in in een "grote" tekstverwerker.




Wanneer deze tekst wordt weggeschreven in rtf-formaat, en daarna geopend met een tekst-editor zie je de instructies die "tussen" de tekst staan. Tekst begint op lijn 16. Alle instructies ervoor zijn de "overhead", de bijkomende informatie die de instructies voor de formattering en de tekst-attributen doorgeeft aan de tekstverwerker, die voor de interpretatie zorgt.




Wanneer je de tekst opslaat als een .doc-bestand, en zou openen met een  tekst-editor, dan zie je enkel binaire, onleesbare tekentjes.
Dit staat als .doc op de schijf. (dit is het eerst deel)



Dit is het eerste deel van wat als .docx op de schijf staat.



De eerste twee letter ("PK") wijzen er op dat dit een gecomprimeerd formaat is. Het compressiealgoritme (uit 1986) is van Phil Katz en staat bekend als PKZip. Het ZIP-formaat is nu publiek domein.
Microsoft gebruikt dit (gratis) compressiealgoritme om de bestandsgrootte te beperken (ongeveer 30% van de oorspronkelijke grootte), en omdat dit zip-formaat gemakkelijk te beveiligen is met een wachtwoord.

Dit .docx bestand bevat intern meerdere xml-bestanden:



De inhoud van het bestand \word\document.xml bevat de tekst (in zwart).



Opmerkingen


Soort
platte tekst
.rtf document
.doc
document
.docx
document
open-document
html-document
Voorbeeld van bestandsnaam
Platte-tekst.txt document.rtf Microsoft-document.doc Microsoft-document.docx Open-document.odt webpagina.html
Extensie
.txt
.rtf
.doc
.docx
.odt
.html
Inhoud
platte tekst platte tekst
binair bestand ZIP met daarin XML-bestanden binair bestand platte tekst
Formattering is mogelijk
neen
ja
ja
ja
ja
ja
Voor het eerst gebruikt 1960 1987 1997 2007 2005 1991
ISO-certifiëring
ja
neen
neen
ja (Microsoft voorstel)
ja
ja
Creatie
Microsoft Microsoft Microsoft Open Software Foundation
Programma voor opmaak
tekst-editor
tekstverwerker tekstverwerker
tekstverwerker tekstverwerker html-editor
Voorbeeld van gratis programma
Kladblok
LibreOffice Writer LibreOffice Writer
LibreOffice Writer
Microsoft Office Online
LibreOffice Writer
Kompozer
Voorbeeld van te betalen programma

Microsoft Office Word
Microsoft Office Word Microsoft Office Word 2007, 2010, 2013, 365 Microsoft Office Word 2007, 2010, 2013
Adobe Dreamweaver
Programma om te bekijken, te lezen
tekst-editor tekstverwerker tekstverwerker tekstverwerker tekstverwerker web-browser
Tekst aangepast aan  weergave- venster weergave- venster pagina pagina pagina weergave- venster
Tekst kan gewijzigd worden door het kijk-programma
ja
ja
ja
ja
ja
neen
Lezer moet hetzelfde programma hebben
neen
neen
ja
ja
ja
neen
Bruikbaar bij presentatie
neen
neen
neen
neen
neen
ja
Alles in één bestand
ja
ja
ja
ja
ja
neen
Multimedia opties
neen
beperkt
ja
ja
ja
beperkt
Link opties neen neen ja ja ja ja