kategória | ||||||||||
|
||||||||||
|
||
Az írásjelek kódolására többféle kódrendszert használhatunk, de számítógépes környetzetben az alábbiakat szoktuk használni::
- ASCII(American National Standard Code for Information Interchange),
- EBCDIC(Extended Binary Coded Decimal Interchange Code).
Az ASCII először 7 bites volt, ezzel 128 karaktert lehetett ábrázolni, de később 8 bites lett, ami 256 karakter kódolását tette lehetővé és ma már szinte kizárólag ezt a formáját használjuk. Az EBCDIC kód 8 bites és elsősorban a mainframe-eken volt használatos. Mindkét kódrendszerben az alábbiak szerint csoportosíthatjuk az írásjeleket:
Numerikus jelek :0..9
Alfabetikus jelek: az angol ABC nagy és kis betűi (a..z, A..Z)
Ezeket együtt Alfanumerikus jeleknek nevezzük.
speciális jelek:(ilyen pl.:?-+/*.,;(`") kódjuk a 2016 és a 7F16 közé esik.
grafikai jelek (ilyenek pl. a magyar ABC ékezetes betűi): kódjuk 8016 és FF16 közé esik.
vezérlési információk kódjai: a kódtábla elején vannak, és általában nincs látható formájuk.
ilyen pl.: STX:szöveg eleje,ETX:szöveg vége.
A 256 féle írásjel csakhamar kevésnek bizonyult, ezért a grafikus jelek tartományát a szükségnek megfelelően sokféle változatban szabványosították. Ezeket a változatokat kódtábláknak hívjuk.
Néhány fontosabb változat:
437-es: az USA-ban és 939b14j Angliában használatos kódtábla, az ASCII eredeti formája.
850-es Inter- Language (nemzetközi) kódtábla, ami az indoeurópai nyelvek karaktereit tartalmazza.
852-es vagy Latin- 2 kódtábla, ami a latin betűs szláv népek írásjeleit fogja össze. Ebbe sorolták a magyar nyelv ékezetes karaktereit is.
ASCII-852
|
|
|
|
|
|
|
|
|
|
|
A |
B |
C |
D |
E |
F |
|
NUL |
SOH |
STX |
ETX |
EOT |
ENQ |
ACK |
BEL |
BS |
HT |
LF |
VT |
FF |
CR |
SO |
SI |
|
DLE |
DC1 |
DC2 |
DC3 |
DC4 |
NAK |
SYN |
ETB |
CAN |
EM |
SUB |
ESC |
FS |
GS |
RS |
US |
|
SP |
|
" |
|
|
|
& |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
< |
|
> |
|
|
|
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
K |
L |
M |
N |
O |
|
P |
Q |
R |
S |
T |
U |
V |
W |
X |
Y |
Z |
|
|
|
|
|
|
|
a |
b |
c |
d |
e |
f |
g |
h |
i |
j |
k |
l |
m |
n |
o |
|
p |
q |
r |
s |
t |
u |
v |
w |
x |
y |
z |
|
|
NUL |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
B |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
C |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
D |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
E |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
F |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A grafikus felhasználói felületek elterjedésével az ASCII szabványt kissé módosították az ANSI (American National Standards Institute) ajánlása alapján. Ilyen szabványt használ pl. a WINDOWS is.
ANSI 1200-as: a WINDOWS karaktertáblázata angol nyelvű környezetben.
ANSI 1250-es: a WINDOWS speciális kódlapja, a magyar ékezetes karaktereket is tartalmazza.
Újabban a Xerox javaslatára az írásjelek kódolására a UNICODE szabványt, 2-2 bájtot használunk. Ez 65536 karakterkódot jelent, amiben elfér a világ összes használt írásjele. Az ASCII, illetve az ANSI szabvány legfontosabb karakterei a 0-255 értékekkel lettek megadva, ilyenkor a második bájt a UNICODE-ban csupa nulla bitet tartalmaz. A magyar ékezetes betűk közül néhány, pl. az Ő és az Ű, nem került be a 0-255 közé, ezek UNICODE kódjában a második bájt nem csupa nulla. A WINDOWS kataógusaiban a fájl- és mappanevek ma már így vannak megadva. Nagyobb adatállományok UNICODE-ban való kódolása azonban jelentős tárpazarlással jár, ezért lehetőséget kell biztosítani a tömörítésre. Ez a az operációs rendszerek újabb verzióinak a dolga lesz.
Találat: 2590