Preučevanje različnih kodnih tabel (character encoding) s pomočjo brskalnika Firefox
Za spletno stran sem si izbral DOM MONT. Ko spreminjam kodne tabele ( character encoding ) se šumniki zamenjajo z znakom oziroma s črko glede na tisto kodno tabelo katero sem izbral.
Navodila za uporabo kodnih tabel:
- odprite Firefox
- zgoraj v orodni vrstici pritisnete "Pogled"
- kodiranje znakov ( character encoding )
- Izberite tisto kodiranje znakov katero potrebujete za delo
Kodne tabele
Imenujemo tudi kodni razpored. Povezuje grafično predstavitev nekega znaka z njegovim binarnim zapisom.
Kodiranje znakov uporabljajo po večini internetni brskalniki, da nam lepše prikažejo vsebino internetne strani. Najbolj univerzalno kodiranje je UTF-8, prikaže večino znakov nam znanih. Poznamo še Windows-1250 in ASCII, ki se tudi dosti uporabljata. ASCII kodiranje je bilo dolgo časa najbolj uporabno vendar ga je leta 2007 zamenjal UTF-8. ASCII pozna 128 znakov od tega jih 33 ne moremo napisati (non-printable), 94 jih lahko napišemo in presledek je upoštevan kot nevidna grafika. UTF-8 je 8bitna koda, ki je direktno povezana z ASCII (pozna ASCII znake). Prvih 128 znakov je enakih kot pri ASCII. UTF-8 je narejen iz 1-4 oktetov in prvih 128 znakov zavzame 1 oktet z enakim binarnim kodiranjem. Windows-1250 je kodiranje narejeno samo za centralno in južno Evropo, kjer se uporablja latinsko abecedo. Sestavljen je po ISO-8859-2 vendar so nekateri znaki preurejeni.
ASCII (American Standard Code for Information Interchange), je vgrajena binarna koda, ki predstavlja znake na vseh računalnikih razen IBM maifraemih , ki uporabljajo EBCDIC kodirni sistem. ASCII uporablja samo sedem bitov/znak, kar nam omogoča 128 kombinacij, ki vključujejo male in velike črke, cifre in posebne simbole kot so %, $. 32 prvih znakov je rezervirano za komunikacijo in nadzor tiskanja.
Win-1250 je koda strani uporabljena v Microsoft Windows za predstavitev srednjeevropskih in vzhodnoevropskih jezikih, ki uporabljajo latinico kot so česki, poljski, madžarski, slovaški, slovenski, bosanski, hrvaški, srbski (latinica), romunski in albanski. Lahko je uporabljena tudi v nemškim jezikom.
UTF-8 (8-bit Unicode Transformation Format) je znak spremenljive dolžine kodiranja za Unicode. Je eno izmed načinov kodiranja.
Kodni podpis
- ASCII
Priimek: 01001000 (H) 01010010 (R) 01001111 (O) 01010110 (V) 01000001 (A) 01010100 (T)
- WIN- 1250
Priimek: 0x0048 (H) 0x0052 (R) 0x004F (O) 0x0056 (V) 0x0041 (A) 0x0054 (T)
- UTF- 8
Priimek: 00072 (H) 00082 (R) 00079 (O) 00086 (V) 00065 (A) 00084 (T)
Ni komentarjev:
Objavite komentar