petek, 22. oktober 2010

Character encoding - kodiranje znakov - Digitalni računalnik II - vaja 03

Preučevanje različnih kodnih tabel (character encoding) s pomočjo brskalnika Firefox

Za spletno stran sem si izbral DOM MONT. Ko spreminjam kodne tabele ( character encoding ) se šumniki zamenjajo z znakom oziroma s črko glede na tisto kodno tabelo katero sem izbral.

Navodila za uporabo kodnih tabel:

  • odprite Firefox
  • zgoraj v orodni vrstici pritisnete "Pogled"
  • kodiranje znakov ( character encoding )
  • Izberite tisto kodiranje znakov katero potrebujete za delo
Če spreminjamo encoding na določeni strani, se spreminjajo določene črke in znaki, ki niso kodirani v skladu s kodiranjem, ki ste ga nastavili.

Kodne tabele

Imenujemo tudi kodni razpored. Povezuje grafično predstavitev nekega znaka z njegovim binarnim zapisom.
Kodiranje znakov uporabljajo po večini internetni brskalniki, da nam lepše prikažejo vsebino internetne strani. Najbolj univerzalno kodiranje je UTF-8, prikaže večino znakov nam znanih. Poznamo še Windows-1250 in ASCII, ki se tudi dosti uporabljata.  ASCII kodiranje je bilo dolgo časa najbolj uporabno vendar ga je leta 2007 zamenjal  UTF-8. ASCII pozna 128 znakov od tega jih 33 ne moremo napisati (non-printable), 94 jih lahko napišemo in presledek je upoštevan kot nevidna grafika. UTF-8 je 8bitna koda, ki je direktno povezana z ASCII (pozna ASCII znake). Prvih 128 znakov je enakih kot pri ASCII. UTF-8 je narejen iz 1-4 oktetov in prvih 128 znakov zavzame 1 oktet z enakim binarnim kodiranjem. Windows-1250 je kodiranje narejeno samo za centralno in južno Evropo, kjer se uporablja latinsko abecedo. Sestavljen je po ISO-8859-2 vendar so nekateri znaki preurejeni.  


ASCII (American Standard Code for Information Interchange), je vgrajena binarna koda, ki predstavlja znake na vseh računalnikih razen IBM maifraemih , ki uporabljajo EBCDIC kodirni sistem. ASCII uporablja samo sedem bitov/znak, kar nam omogoča 128 kombinacij, ki vključujejo male in velike črke, cifre in posebne simbole kot so %, $. 32 prvih znakov je rezervirano za komunikacijo in nadzor tiskanja.

Win-1250 je koda strani uporabljena v Microsoft Windows za predstavitev srednjeevropskih in vzhodnoevropskih jezikih, ki uporabljajo latinico kot so česki, poljski, madžarski, slovaški, slovenski, bosanski, hrvaški, srbski (latinica), romunski in albanski. Lahko je uporabljena tudi v nemškim jezikom.

UTF-8 (8-bit Unicode Transformation Format) je znak spremenljive dolžine kodiranja za Unicode. Je eno izmed načinov kodiranja.


Kodni podpis

  • ASCII 
Ime: 01010000 (P) 01000101 (E) 01010100 (T) 01000101 (E) 01010010 (R)
Priimek: 01001000 (H) 01010010 (R) 01001111 (O) 01010110 (V) 01000001 (A) 01010100 (T)

  • WIN- 1250
Ime: 0x0050 (P) 0x0045 (E) 0x0054 (T) 0x0045 (E) 0x0052 (R)
Priimek: 0x0048 (H) 0x0052 (R) 0x004F (O) 0x0056 (V) 0x0041 (A) 0x0054 (T)

  •  UTF- 8
Ime: 00080 (P) 00069 (E) 00084 (T) 00069 (E) 00082 (R)
Priimek: 00072 (H) 00082 (R) 00079 (O) 00086 (V) 00065 (A) 00084 (T)







Ni komentarjev:

Objavite komentar