1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
|
#include "wchar.class.h"
wchar wchar::CP437[] = { //These are the UTF8 equivalents for the 128 extra characters of code page 850
"Ç", "ü", "é", "â", "ä", "à", "å", "ç", "ê", "ë", "è", "ï", "î", "ì", "Ä", "Å",
"É", "æ", "Æ", "ô", "ö", "ò", "û", "ù", "ÿ", "Ö", "Ü", "¢", "£", "¥", "₧", "ƒ",
"á", "í", "ó", "ú", "ñ", "Ñ", "ª", "º", "¿", "⌐", "¬", "½", "¼", "¡", "«", "»",
"░", "▒", "▓", "│", "┤", "╡", "╢", "╖", "╕", "╣", "║", "╗", "╝", "╜", "╛", "┐",
"└", "┴", "┬", "├", "─", "┼", "╞", "╟", "╚", "╔", "╩", "╦", "╠", "═", "╬", "¤",
"╨", "╤", "╥", "╙", "╘", "╒", "╓", "╫", "╪", "┘", "┌", "█", "▄", "▌", "▐", "▀",
"α", "ß", "Γ", "π", "Σ", "σ", "µ", "τ", "Φ", "Θ", "Ω", "δ", "∞", "φ", "ε", "∩",
"≡", "±", "≥", "≤", "⌠", "⌡", "÷", "≈", "°", "∙", "·", "√", "ⁿ", "²", "■", "⍽"
};
wchar::wchar() {
value = 0;
}
wchar::wchar(char c) {
affectAscii(c);
}
wchar::wchar(char* c) {
affectUtf8(c);
}
u32int wchar::utf8len(char* c) {
int i = 0, l = CMem::strlen(c), co = 0;
while (i < l) {
if ((c[i] & 0x80) == 0) i += 1;
else if ((c[i] & 0xE0) == 0xC0) i += 2;
else if ((c[i] & 0xF0) == 0xE0) i += 3;
else if ((c[i] & 0xF8) == 0xF0) i += 4;
else i += 1;
co++;
}
return co;
}
void wchar::affectAscii(char c) {
if (c >= 0) value = c;
else value = CP437[c + 128];
}
u32int wchar::affectUtf8(char* c) { //Returns the number of bytes for the character
if ((c[0] & 0x80) == 0) {
value = c[0]; //0x80 = 10000000b
return 1;
}
if ((c[0] & 0xE0) == 0xC0) { // 11100000b, 11000000b
value = ((c[0] & 0x1F) << 6) | (c[1] & 0x3F);
if (value < 128) value = 0; //Bad value
return 2;
}
if ((c[0] & 0xF0) == 0xE0) { // 11110000b, 11100000b
value = ((c[0] & 0x0F) << 12) | ((c[1] & 0x3F) << 6) | (c[2] & 0x3F);
if (value < 2048) value = 0; //Bad value
return 3;
}
if ((c[0] & 0xF8) == 0xF0) { // 11111000b, 11110000b
value = ((c[0] & 0x0E) << 18) | ((c[1] & 0x3F) << 12) | ((c[2] & 0x3F) << 6) | (c[3] & 0x3F);
if (value < 65536) value = 0; //Bad value
return 4;
}
value = 0; //Something wrong happenned
return 1;
}
u8int wchar::toAscii() {
if (value < 128) return (char)value;
for (int i = 0; i < 128; i++) {
if (CP437[i] == value) return (i + 128);
}
return '?';
}
|