|
Ați instalat și configurat tot ce trebuie – sistem, tastatură. Vă pregătiți să trimiteți un mesaj și vă propuneți să-l scrieți în limba română. Sunteți sigur că mesajul va fi reprodus corect la destinație ?
Note: În cele ce urmează, prin „a scrie în română” se subînțelege un text sau fragment de text care folosește diacritice. Se are în vedere schimbul de informație prin intermediul textelor de e-mail, dar cele descrise mai jos sunt aplicabile și pentru crearea paginilor de internet.
Problemele pot fi diferite atunci cînd:
(i) Vreți să compuneți un text destinat altcuiva
Practica arată că varza cea mai des întîlnită este în privința mesajelor de e‑mail. Deși soluțiile sunt relativ simple, în mod misterios ceva merge împiedicat.
|
|
|
exemplu de selectare a codării mesajului (clientul de e-mail Sylpheed)
|
|
Este de reținut că în general limba engleză americană este clasificată ca „US-ASCII” sau „Western”, iar limba română ca „Central European”.
Cazul fericit este cînd sistemul a fost configurat corect (cu setările de localizare pe română), iar programul de e-mail ține cont de ele. Cazul nefericit este cînd nimeni nu s-a obosit să configureze ceva, iar programul de e-mail lucrează de capul lui. În acest ultim caz specificarea codării trebuie verificată și eventual corectată manual.
Unde trebuie umblat la cîteva dintre programele de e-mail uzuale: Windows Mail, Outlook Express, sau Outlook: în meniul ferestrei de compunere a mesajului -> clic pe Format -> Codificare -> se alege din lista desfășurată una dintre codările descrise aici mai jos (la Outlook, în caz că este selectat „Automatic”, este de preferat să fie lăsat așa) Windows Live Mail: în meniul ferestrei de compunere a mesajului -> clic pe Opțiuni -> clic pe Codificare -> se alege din lista desfășurată una dintre codările descrise aici mai jos Mozilla Thunderbird: în meniul ferestrei de compunere a mesajului -> clic pe Opțiuni -> Codare caractere -> se alege din lista desfășurată una dintre codările descrise aici mai jos Ximian Evolution: în meniul ferestrei de compunere a mesajului -> clic pe Editare -> Codare caractere -> se alege din lista desfășurată una dintre codările descrise aici mai jos
În meniurile exemplificate mai sus se poate alege:
- codarea standardizată UTF-8
- codarea standardizată ISO/IEC-8859-2 (Latin 2)
- codarea standardizată ISO/IEC-8859-16 (Latin 10)
- codarea proprietară Windows CP-1250 (Windows Central European).
Notă: mai există codarea proprietară MacRomanian, provenită de la sistemele Apple MacOS de generație mai veche, dar în anul 2013 deja se poate uita de ea; pe platforma Apple MacOS este o codare perimată, iar pe platforme non-Apple este o codare practic nesuportată
Pro și contra:
codarea UTF-8
- avantaj
- se poate scrie, transmite și citi orice caracter imaginabil, în orice limbă (afirmația este valabilă cu condiția să existe și un font care să conțină glifa respectivă, în caz contrar textul fiind afișat cu găuri din loc în loc)
- dezavantaj
- în anul 2013 deja nu mai există niciunul; lipsa disponibilității acestui tip de codare ține de-acum mai degrabă doar de proasta configurare a sistemelor sau a aplicațiilor decât de incapacitatea acestora de a gestiona acest tip de codare
codarea ISO/IEC-8859-2
- avantaj
- recunoscută de orice program de e-mail decent, indiferent de platforma pe care rulează
- dezavantaj
- în anul 2013 este deja o codare anacronică
- lipsesc caracterle ș și ț cu virgulă (vedeți aici detalii pe această temă)
- lipsesc ghilimelele românești „ și ”, cele alternative « și », precum și simbolul € (Euro)
codarea ISO/IEC-8859-16
- avantaj
- prezintă o îmbunătățire lingvistică a codării ISO/IEC-8859-2; setul de caractere extins conține practic toate caracterle utile limbii române (cu excepția caracterului – (liniuță de dialog / pauză orizontală (denumită uneori și pauză albă); Unicode 2013)
- dezavantaj
- în anul 2013 este deja o codare anacronică, datorită trecerii pe linie moartă a codărilor pe 8 biți
- fiind apărută relativ tîrziu, nu toate sistemele recunosc acest tip de codare; un caz notabil este sistemul de operare Microsoft Windows (a se vedea aici detalii pe această temă)
codarea Windows CP-1250 (Windows Central European)
- avantaj
- dezavantaj
- în anul 2013 este deja o codare anacronică, datorită trecerii pe linie moartă a codărilor pe 8 biți
- fiind un sistem de codare proprietar, este recunoscut cu ușurință doar de aplicațiile create de Microsoft; aplicațiile alternative, indiferent de platforma pe care rulează, nu se simt obligate să suporte acest tip de codare
- se poate întîmpla ca în cazul sistemelor de operare alternative, altele decît Windows, suportul pentru acest tip de codare să existe ca principiu dar să nu fi fost instalat (depinde în mare măsură de cel care a instalat și/sau configurat sistemul)
Ca o concluzie: nu folosiți alt tip de codare în afara celor descrise mai sus atunci cînd scrieți un mesaj de e-mail în limba română ! Același lucru este valabil și pentru crearea paginilor de internet.
(ii) Vreți să citiți un text primit de la altcineva
În mod normal, în momentul trimiterii unui mesaj de e-mail, programul include o informație suplimentară sub forma unei linii de text în antetulul mesajului. Linia conține (și) informația despre cum a fost codat textul: Content-Type: text/plain; charset="UTF-8" În exemplul arătat codarea este de tip UTF-8, dar în practică poate fi alta în funcție de alegerea celui care a trimis mesajul / cum a fost configurat sistemul sau programul de e-mail / pur și simplu cum s-a nimerit să fie.
Programul de e-mail care primește mesajul știe să interpreteze informația din acea linie și decodează textul în mod corespunzător.
Există însă cazuri în care cel care trimite mesajul a ales greșit codarea paginii, sau n-a ales nimic și era greșită fără ca el să știe. Mai rar, informația despre codare lipsește pur și simplu. Cea mai des întîlnită greșeală este de tipul: mesaj care conține un text scris în limba română, dar la care codarea a rămas pe engleză americană (US-ASCII, eventual ISO-8859-1 sau Windows CP-1252). Într-un astfel de caz, la citire, datorită înlocuirii anumitor caractere românești, mesajul poate să devină greu sau imposibil de citit. Până prin anul 2007, un mesaj trimis de pe Yahoo se încadra inevitabil în această situație, de-atunci însă au trecut și ei (în sfârșit) la Unicode UTF-8.
Soluția în situația primirii unui astfel de mesaj este relativ simplă: forțarea de către utilizator (cel care citește mesajul) a afișării într-un cod de pagină compatibil cu limba română. Singura problemă este că trebuie mers pe ghicite.
|
exemplul 1: un mesaj trimis de pe interfața Yahoo Mail până acum câțiva ani
la momentul trimiterii mesajului, cel care a scris și trimis mesajul era convins că a scris corect în limba română, dar de fapt asta este ceeace vedea destinatarul
|
|
|
|
exemplul 2: același mesaj la care cel care citește mesajul forțează din meniu o codare compatibilă cu limba română
codarea selectată în acest exemplu este Central European (Windows CP-1250)
|
|
|
Se pot încerca următoarele variante:
forțarea codarării Windows CP-1250 (Windows Central European) De ce asta și nu alta: pentru că sunt șanse ca mesajul să fi fost creat cu ajutorul unei interfețe de tip web-mail (genul Yahoo), folosind, să zicem, programul Internet Explorer, pe un calculator pe care era instalat sistemul de operare Microsoft Windows. În acest caz este posibil ca aplicația folosită la crearea și trimiterea mesajului să fi folosit o codare nativă Windows.
forțarea codarării ISO/IEC-8859-2 De ce asta și nu alta: pentru că sunt șanse ca mesajul să fi fost creat cu ajutorul unei interfețe de tip web-mail (genul Yahoo), folosind, să zicem, programul Mozilla Firefox, pe un calculator pe care era instalat sistemul de operare Linux. În acest caz este posibil ca aplicația folosită la crearea și trimiterea mesajului să fi folosit o codare de tip ISO.
Notă: strict din punctul de vedere al diacriticelor românești suportate (ă â și î și majusculele Ă Â și Î asociate) nu este nicio diferență între codările Windows CP-1250 și ISO-8859-2; diferențele apar la alte caractere, cum ar fi de exemplu la ghilimelele românești „ și ” sau la semnul € (Euro)
|

|
|
un mesaj codat UTF-8, la a cărui afișare s-a folosit o codare greșită
|
|
forțarea codarării UTF-8 De ce asta și nu alta: doar în situația în care mesajul vă apare afișat cam cum se vede în imaginea alăturată:
forțarea codarării ISO/IEC-8859-16 (acolo unde aplicația are această opțiune) De ce asta și nu alta: sincer să fiu nu prea aveți nici un motiv, deoarece șansele ca mesajul să fi fost creat folosindu-se acest tip de codare sunt nule :)
Notă: în cazul citirii mesajelor scrise în română cu ajutorul unei interfețe de tip „webmail” (genul Yahoo), forțarea codării se poate efectua din meniul browserului folosit, într-un mod similar cu cel descris la programele de e-mail
Ca o concluzie: dacă mesajul primit vă apare afișat aiurea, încercați la nimereală schimbarea codării din programul cu care citiți respectivul mesaj, pentru că sunt șanse ca pînă la urmă să vedeți corect respectivul mesaj !
[Sus de tot]
|