1 |
|
|
/* $OpenBSD: chars.c,v 1.43 2017/08/23 13:01:22 schwarze Exp $ */ |
2 |
|
|
/* |
3 |
|
|
* Copyright (c) 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv> |
4 |
|
|
* Copyright (c) 2011, 2014, 2015, 2017 Ingo Schwarze <schwarze@openbsd.org> |
5 |
|
|
* |
6 |
|
|
* Permission to use, copy, modify, and distribute this software for any |
7 |
|
|
* purpose with or without fee is hereby granted, provided that the above |
8 |
|
|
* copyright notice and this permission notice appear in all copies. |
9 |
|
|
* |
10 |
|
|
* THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES |
11 |
|
|
* WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF |
12 |
|
|
* MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR |
13 |
|
|
* ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES |
14 |
|
|
* WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN |
15 |
|
|
* ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF |
16 |
|
|
* OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE. |
17 |
|
|
*/ |
18 |
|
|
#include <sys/types.h> |
19 |
|
|
|
20 |
|
|
#include <assert.h> |
21 |
|
|
#include <ctype.h> |
22 |
|
|
#include <stddef.h> |
23 |
|
|
#include <stdint.h> |
24 |
|
|
#include <stdlib.h> |
25 |
|
|
#include <string.h> |
26 |
|
|
|
27 |
|
|
#include "mandoc.h" |
28 |
|
|
#include "mandoc_aux.h" |
29 |
|
|
#include "mandoc_ohash.h" |
30 |
|
|
#include "libmandoc.h" |
31 |
|
|
|
32 |
|
|
struct ln { |
33 |
|
|
const char roffcode[16]; |
34 |
|
|
const char *ascii; |
35 |
|
|
int unicode; |
36 |
|
|
}; |
37 |
|
|
|
38 |
|
|
/* Special break control characters. */ |
39 |
|
|
static const char ascii_nbrsp[2] = { ASCII_NBRSP, '\0' }; |
40 |
|
|
static const char ascii_break[2] = { ASCII_BREAK, '\0' }; |
41 |
|
|
|
42 |
|
|
static struct ln lines[] = { |
43 |
|
|
|
44 |
|
|
/* Spacing. */ |
45 |
|
|
{ " ", ascii_nbrsp, 0x00a0 }, |
46 |
|
|
{ "~", ascii_nbrsp, 0x00a0 }, |
47 |
|
|
{ "0", " ", 0x2002 }, |
48 |
|
|
{ "|", "", 0 }, |
49 |
|
|
{ "^", "", 0 }, |
50 |
|
|
{ "&", "", 0 }, |
51 |
|
|
{ "%", "", 0 }, |
52 |
|
|
{ ":", ascii_break, 0 }, |
53 |
|
|
/* XXX The following three do not really belong here. */ |
54 |
|
|
{ "t", "", 0 }, |
55 |
|
|
{ "c", "", 0 }, |
56 |
|
|
{ "}", "", 0 }, |
57 |
|
|
|
58 |
|
|
/* Lines. */ |
59 |
|
|
{ "ba", "|", 0x007c }, |
60 |
|
|
{ "br", "|", 0x2502 }, |
61 |
|
|
{ "ul", "_", 0x005f }, |
62 |
|
|
{ "ru", "_", 0x005f }, |
63 |
|
|
{ "rn", "-", 0x203e }, |
64 |
|
|
{ "bb", "|", 0x00a6 }, |
65 |
|
|
{ "sl", "/", 0x002f }, |
66 |
|
|
{ "rs", "\\", 0x005c }, |
67 |
|
|
|
68 |
|
|
/* Text markers. */ |
69 |
|
|
{ "ci", "O", 0x25cb }, |
70 |
|
|
{ "bu", "+\bo", 0x2022 }, |
71 |
|
|
{ "dd", "<**>", 0x2021 }, |
72 |
|
|
{ "dg", "<*>", 0x2020 }, |
73 |
|
|
{ "lz", "<>", 0x25ca }, |
74 |
|
|
{ "sq", "[]", 0x25a1 }, |
75 |
|
|
{ "ps", "<paragraph>", 0x00b6 }, |
76 |
|
|
{ "sc", "<section>", 0x00a7 }, |
77 |
|
|
{ "lh", "<=", 0x261c }, |
78 |
|
|
{ "rh", "=>", 0x261e }, |
79 |
|
|
{ "at", "@", 0x0040 }, |
80 |
|
|
{ "sh", "#", 0x0023 }, |
81 |
|
|
{ "CR", "<cr>", 0x21b5 }, |
82 |
|
|
{ "OK", "\\/", 0x2713 }, |
83 |
|
|
{ "CL", "<club>", 0x2663 }, |
84 |
|
|
{ "SP", "<spade>", 0x2660 }, |
85 |
|
|
{ "HE", "<heart>", 0x2665 }, |
86 |
|
|
{ "DI", "<diamond>", 0x2666 }, |
87 |
|
|
|
88 |
|
|
/* Legal symbols. */ |
89 |
|
|
{ "co", "(C)", 0x00a9 }, |
90 |
|
|
{ "rg", "(R)", 0x00ae }, |
91 |
|
|
{ "tm", "tm", 0x2122 }, |
92 |
|
|
|
93 |
|
|
/* Punctuation. */ |
94 |
|
|
{ "em", "--", 0x2014 }, |
95 |
|
|
{ "en", "-", 0x2013 }, |
96 |
|
|
{ "hy", "-", 0x2010 }, |
97 |
|
|
{ "e", "\\", 0x005c }, |
98 |
|
|
{ ".", ".", 0x002e }, |
99 |
|
|
{ "r!", "!", 0x00a1 }, |
100 |
|
|
{ "r?", "?", 0x00bf }, |
101 |
|
|
|
102 |
|
|
/* Quotes. */ |
103 |
|
|
{ "Bq", ",,", 0x201e }, |
104 |
|
|
{ "bq", ",", 0x201a }, |
105 |
|
|
{ "lq", "\"", 0x201c }, |
106 |
|
|
{ "rq", "\"", 0x201d }, |
107 |
|
|
{ "Lq", "\"", 0x201c }, |
108 |
|
|
{ "Rq", "\"", 0x201d }, |
109 |
|
|
{ "oq", "`", 0x2018 }, |
110 |
|
|
{ "cq", "\'", 0x2019 }, |
111 |
|
|
{ "aq", "\'", 0x0027 }, |
112 |
|
|
{ "dq", "\"", 0x0022 }, |
113 |
|
|
{ "Fo", "<<", 0x00ab }, |
114 |
|
|
{ "Fc", ">>", 0x00bb }, |
115 |
|
|
{ "fo", "<", 0x2039 }, |
116 |
|
|
{ "fc", ">", 0x203a }, |
117 |
|
|
|
118 |
|
|
/* Brackets. */ |
119 |
|
|
{ "lB", "[", 0x005b }, |
120 |
|
|
{ "rB", "]", 0x005d }, |
121 |
|
|
{ "lC", "{", 0x007b }, |
122 |
|
|
{ "rC", "}", 0x007d }, |
123 |
|
|
{ "la", "<", 0x27e8 }, |
124 |
|
|
{ "ra", ">", 0x27e9 }, |
125 |
|
|
{ "bv", "|", 0x23aa }, |
126 |
|
|
{ "braceex", "|", 0x23aa }, |
127 |
|
|
{ "bracketlefttp", "|", 0x23a1 }, |
128 |
|
|
{ "bracketleftbt", "|", 0x23a3 }, |
129 |
|
|
{ "bracketleftex", "|", 0x23a2 }, |
130 |
|
|
{ "bracketrighttp", "|", 0x23a4 }, |
131 |
|
|
{ "bracketrightbt", "|", 0x23a6 }, |
132 |
|
|
{ "bracketrightex", "|", 0x23a5 }, |
133 |
|
|
{ "lt", ",-", 0x23a7 }, |
134 |
|
|
{ "bracelefttp", ",-", 0x23a7 }, |
135 |
|
|
{ "lk", "{", 0x23a8 }, |
136 |
|
|
{ "braceleftmid", "{", 0x23a8 }, |
137 |
|
|
{ "lb", "`-", 0x23a9 }, |
138 |
|
|
{ "braceleftbt", "`-", 0x23a9 }, |
139 |
|
|
{ "braceleftex", "|", 0x23aa }, |
140 |
|
|
{ "rt", "-.", 0x23ab }, |
141 |
|
|
{ "bracerighttp", "-.", 0x23ab }, |
142 |
|
|
{ "rk", "}", 0x23ac }, |
143 |
|
|
{ "bracerightmid", "}", 0x23ac }, |
144 |
|
|
{ "rb", "-\'", 0x23ad }, |
145 |
|
|
{ "bracerightbt", "-\'", 0x23ad }, |
146 |
|
|
{ "bracerightex", "|", 0x23aa }, |
147 |
|
|
{ "parenlefttp", "/", 0x239b }, |
148 |
|
|
{ "parenleftbt", "\\", 0x239d }, |
149 |
|
|
{ "parenleftex", "|", 0x239c }, |
150 |
|
|
{ "parenrighttp", "\\", 0x239e }, |
151 |
|
|
{ "parenrightbt", "/", 0x23a0 }, |
152 |
|
|
{ "parenrightex", "|", 0x239f }, |
153 |
|
|
|
154 |
|
|
/* Arrows and lines. */ |
155 |
|
|
{ "<-", "<-", 0x2190 }, |
156 |
|
|
{ "->", "->", 0x2192 }, |
157 |
|
|
{ "<>", "<->", 0x2194 }, |
158 |
|
|
{ "da", "|\bv", 0x2193 }, |
159 |
|
|
{ "ua", "|\b^", 0x2191 }, |
160 |
|
|
{ "va", "^v", 0x2195 }, |
161 |
|
|
{ "lA", "<=", 0x21d0 }, |
162 |
|
|
{ "rA", "=>", 0x21d2 }, |
163 |
|
|
{ "hA", "<=>", 0x21d4 }, |
164 |
|
|
{ "uA", "=\b^", 0x21d1 }, |
165 |
|
|
{ "dA", "=\bv", 0x21d3 }, |
166 |
|
|
{ "vA", "^=v", 0x21d5 }, |
167 |
|
|
{ "an", "-", 0x23af }, |
168 |
|
|
|
169 |
|
|
/* Logic. */ |
170 |
|
|
{ "AN", "^", 0x2227 }, |
171 |
|
|
{ "OR", "v", 0x2228 }, |
172 |
|
|
{ "no", "~", 0x00ac }, |
173 |
|
|
{ "tno", "~", 0x00ac }, |
174 |
|
|
{ "te", "<there\037exists>", 0x2203 }, |
175 |
|
|
{ "fa", "<for\037all>", 0x2200 }, |
176 |
|
|
{ "st", "<such\037that>", 0x220b }, |
177 |
|
|
{ "tf", "<therefore>", 0x2234 }, |
178 |
|
|
{ "3d", "<therefore>", 0x2234 }, |
179 |
|
|
{ "or", "|", 0x007c }, |
180 |
|
|
|
181 |
|
|
/* Mathematicals. */ |
182 |
|
|
{ "pl", "+", 0x002b }, |
183 |
|
|
{ "mi", "-", 0x2212 }, |
184 |
|
|
{ "-", "-", 0x002d }, |
185 |
|
|
{ "-+", "-+", 0x2213 }, |
186 |
|
|
{ "+-", "+-", 0x00b1 }, |
187 |
|
|
{ "t+-", "+-", 0x00b1 }, |
188 |
|
|
{ "pc", ".", 0x00b7 }, |
189 |
|
|
{ "md", ".", 0x22c5 }, |
190 |
|
|
{ "mu", "x", 0x00d7 }, |
191 |
|
|
{ "tmu", "x", 0x00d7 }, |
192 |
|
|
{ "c*", "O\bx", 0x2297 }, |
193 |
|
|
{ "c+", "O\b+", 0x2295 }, |
194 |
|
|
{ "di", "/", 0x00f7 }, |
195 |
|
|
{ "tdi", "/", 0x00f7 }, |
196 |
|
|
{ "f/", "/", 0x2044 }, |
197 |
|
|
{ "**", "*", 0x2217 }, |
198 |
|
|
{ "<=", "<=", 0x2264 }, |
199 |
|
|
{ ">=", ">=", 0x2265 }, |
200 |
|
|
{ "<<", "<<", 0x226a }, |
201 |
|
|
{ ">>", ">>", 0x226b }, |
202 |
|
|
{ "eq", "=", 0x003d }, |
203 |
|
|
{ "!=", "!=", 0x2260 }, |
204 |
|
|
{ "==", "==", 0x2261 }, |
205 |
|
|
{ "ne", "!==", 0x2262 }, |
206 |
|
|
{ "ap", "~", 0x223c }, |
207 |
|
|
{ "|=", "-~", 0x2243 }, |
208 |
|
|
{ "=~", "=~", 0x2245 }, |
209 |
|
|
{ "~~", "~~", 0x2248 }, |
210 |
|
|
{ "~=", "~=", 0x2248 }, |
211 |
|
|
{ "pt", "<proportional\037to>", 0x221d }, |
212 |
|
|
{ "es", "{}", 0x2205 }, |
213 |
|
|
{ "mo", "<element\037of>", 0x2208 }, |
214 |
|
|
{ "nm", "<not\037element\037of>", 0x2209 }, |
215 |
|
|
{ "sb", "<proper\037subset>", 0x2282 }, |
216 |
|
|
{ "nb", "<not\037subset>", 0x2284 }, |
217 |
|
|
{ "sp", "<proper\037superset>", 0x2283 }, |
218 |
|
|
{ "nc", "<not\037superset>", 0x2285 }, |
219 |
|
|
{ "ib", "<subset\037or\037equal>", 0x2286 }, |
220 |
|
|
{ "ip", "<superset\037or\037equal>", 0x2287 }, |
221 |
|
|
{ "ca", "<intersection>", 0x2229 }, |
222 |
|
|
{ "cu", "<union>", 0x222a }, |
223 |
|
|
{ "/_", "<angle>", 0x2220 }, |
224 |
|
|
{ "pp", "<perpendicular>", 0x22a5 }, |
225 |
|
|
{ "is", "<integral>", 0x222b }, |
226 |
|
|
{ "integral", "<integral>", 0x222b }, |
227 |
|
|
{ "sum", "<sum>", 0x2211 }, |
228 |
|
|
{ "product", "<product>", 0x220f }, |
229 |
|
|
{ "coproduct", "<coproduct>", 0x2210 }, |
230 |
|
|
{ "gr", "<nabla>", 0x2207 }, |
231 |
|
|
{ "sr", "<sqrt>", 0x221a }, |
232 |
|
|
{ "sqrt", "<sqrt>", 0x221a }, |
233 |
|
|
{ "lc", "|~", 0x2308 }, |
234 |
|
|
{ "rc", "~|", 0x2309 }, |
235 |
|
|
{ "lf", "|_", 0x230a }, |
236 |
|
|
{ "rf", "_|", 0x230b }, |
237 |
|
|
{ "if", "<infinity>", 0x221e }, |
238 |
|
|
{ "Ah", "<Aleph>", 0x2135 }, |
239 |
|
|
{ "Im", "<Im>", 0x2111 }, |
240 |
|
|
{ "Re", "<Re>", 0x211c }, |
241 |
|
|
{ "wp", "P", 0x2118 }, |
242 |
|
|
{ "pd", "<del>", 0x2202 }, |
243 |
|
|
{ "-h", "/h", 0x210f }, |
244 |
|
|
{ "hbar", "/h", 0x210f }, |
245 |
|
|
{ "12", "1/2", 0x00bd }, |
246 |
|
|
{ "14", "1/4", 0x00bc }, |
247 |
|
|
{ "34", "3/4", 0x00be }, |
248 |
|
|
{ "18", "1/8", 0x215B }, |
249 |
|
|
{ "38", "3/8", 0x215C }, |
250 |
|
|
{ "58", "5/8", 0x215D }, |
251 |
|
|
{ "78", "7/8", 0x215E }, |
252 |
|
|
{ "S1", "^1", 0x00B9 }, |
253 |
|
|
{ "S2", "^2", 0x00B2 }, |
254 |
|
|
{ "S3", "^3", 0x00B3 }, |
255 |
|
|
|
256 |
|
|
/* Ligatures. */ |
257 |
|
|
{ "ff", "ff", 0xfb00 }, |
258 |
|
|
{ "fi", "fi", 0xfb01 }, |
259 |
|
|
{ "fl", "fl", 0xfb02 }, |
260 |
|
|
{ "Fi", "ffi", 0xfb03 }, |
261 |
|
|
{ "Fl", "ffl", 0xfb04 }, |
262 |
|
|
{ "AE", "AE", 0x00c6 }, |
263 |
|
|
{ "ae", "ae", 0x00e6 }, |
264 |
|
|
{ "OE", "OE", 0x0152 }, |
265 |
|
|
{ "oe", "oe", 0x0153 }, |
266 |
|
|
{ "ss", "ss", 0x00df }, |
267 |
|
|
{ "IJ", "IJ", 0x0132 }, |
268 |
|
|
{ "ij", "ij", 0x0133 }, |
269 |
|
|
|
270 |
|
|
/* Accents. */ |
271 |
|
|
{ "a\"", "\"", 0x02dd }, |
272 |
|
|
{ "a-", "-", 0x00af }, |
273 |
|
|
{ "a.", ".", 0x02d9 }, |
274 |
|
|
{ "a^", "^", 0x005e }, |
275 |
|
|
{ "aa", "\'", 0x00b4 }, |
276 |
|
|
{ "\'", "\'", 0x00b4 }, |
277 |
|
|
{ "ga", "`", 0x0060 }, |
278 |
|
|
{ "`", "`", 0x0060 }, |
279 |
|
|
{ "ab", "'\b`", 0x02d8 }, |
280 |
|
|
{ "ac", ",", 0x00b8 }, |
281 |
|
|
{ "ad", "\"", 0x00a8 }, |
282 |
|
|
{ "ah", "v", 0x02c7 }, |
283 |
|
|
{ "ao", "o", 0x02da }, |
284 |
|
|
{ "a~", "~", 0x007e }, |
285 |
|
|
{ "ho", ",", 0x02db }, |
286 |
|
|
{ "ha", "^", 0x005e }, |
287 |
|
|
{ "ti", "~", 0x007e }, |
288 |
|
|
|
289 |
|
|
/* Accented letters. */ |
290 |
|
|
{ "'A", "'\bA", 0x00c1 }, |
291 |
|
|
{ "'E", "'\bE", 0x00c9 }, |
292 |
|
|
{ "'I", "'\bI", 0x00cd }, |
293 |
|
|
{ "'O", "'\bO", 0x00d3 }, |
294 |
|
|
{ "'U", "'\bU", 0x00da }, |
295 |
|
|
{ "'a", "'\ba", 0x00e1 }, |
296 |
|
|
{ "'e", "'\be", 0x00e9 }, |
297 |
|
|
{ "'i", "'\bi", 0x00ed }, |
298 |
|
|
{ "'o", "'\bo", 0x00f3 }, |
299 |
|
|
{ "'u", "'\bu", 0x00fa }, |
300 |
|
|
{ "`A", "`\bA", 0x00c0 }, |
301 |
|
|
{ "`E", "`\bE", 0x00c8 }, |
302 |
|
|
{ "`I", "`\bI", 0x00cc }, |
303 |
|
|
{ "`O", "`\bO", 0x00d2 }, |
304 |
|
|
{ "`U", "`\bU", 0x00d9 }, |
305 |
|
|
{ "`a", "`\ba", 0x00e0 }, |
306 |
|
|
{ "`e", "`\be", 0x00e8 }, |
307 |
|
|
{ "`i", "`\bi", 0x00ec }, |
308 |
|
|
{ "`o", "`\bo", 0x00f2 }, |
309 |
|
|
{ "`u", "`\bu", 0x00f9 }, |
310 |
|
|
{ "~A", "~\bA", 0x00c3 }, |
311 |
|
|
{ "~N", "~\bN", 0x00d1 }, |
312 |
|
|
{ "~O", "~\bO", 0x00d5 }, |
313 |
|
|
{ "~a", "~\ba", 0x00e3 }, |
314 |
|
|
{ "~n", "~\bn", 0x00f1 }, |
315 |
|
|
{ "~o", "~\bo", 0x00f5 }, |
316 |
|
|
{ ":A", "\"\bA", 0x00c4 }, |
317 |
|
|
{ ":E", "\"\bE", 0x00cb }, |
318 |
|
|
{ ":I", "\"\bI", 0x00cf }, |
319 |
|
|
{ ":O", "\"\bO", 0x00d6 }, |
320 |
|
|
{ ":U", "\"\bU", 0x00dc }, |
321 |
|
|
{ ":a", "\"\ba", 0x00e4 }, |
322 |
|
|
{ ":e", "\"\be", 0x00eb }, |
323 |
|
|
{ ":i", "\"\bi", 0x00ef }, |
324 |
|
|
{ ":o", "\"\bo", 0x00f6 }, |
325 |
|
|
{ ":u", "\"\bu", 0x00fc }, |
326 |
|
|
{ ":y", "\"\by", 0x00ff }, |
327 |
|
|
{ "^A", "^\bA", 0x00c2 }, |
328 |
|
|
{ "^E", "^\bE", 0x00ca }, |
329 |
|
|
{ "^I", "^\bI", 0x00ce }, |
330 |
|
|
{ "^O", "^\bO", 0x00d4 }, |
331 |
|
|
{ "^U", "^\bU", 0x00db }, |
332 |
|
|
{ "^a", "^\ba", 0x00e2 }, |
333 |
|
|
{ "^e", "^\be", 0x00ea }, |
334 |
|
|
{ "^i", "^\bi", 0x00ee }, |
335 |
|
|
{ "^o", "^\bo", 0x00f4 }, |
336 |
|
|
{ "^u", "^\bu", 0x00fb }, |
337 |
|
|
{ ",C", ",\bC", 0x00c7 }, |
338 |
|
|
{ ",c", ",\bc", 0x00e7 }, |
339 |
|
|
{ "/L", "/\bL", 0x0141 }, |
340 |
|
|
{ "/l", "/\bl", 0x0142 }, |
341 |
|
|
{ "/O", "/\bO", 0x00d8 }, |
342 |
|
|
{ "/o", "/\bo", 0x00f8 }, |
343 |
|
|
{ "oA", "o\bA", 0x00c5 }, |
344 |
|
|
{ "oa", "o\ba", 0x00e5 }, |
345 |
|
|
|
346 |
|
|
/* Special letters. */ |
347 |
|
|
{ "-D", "Dh", 0x00d0 }, |
348 |
|
|
{ "Sd", "dh", 0x00f0 }, |
349 |
|
|
{ "TP", "Th", 0x00de }, |
350 |
|
|
{ "Tp", "th", 0x00fe }, |
351 |
|
|
{ ".i", "i", 0x0131 }, |
352 |
|
|
{ ".j", "j", 0x0237 }, |
353 |
|
|
|
354 |
|
|
/* Currency. */ |
355 |
|
|
{ "Do", "$", 0x0024 }, |
356 |
|
|
{ "ct", "/\bc", 0x00a2 }, |
357 |
|
|
{ "Eu", "EUR", 0x20ac }, |
358 |
|
|
{ "eu", "EUR", 0x20ac }, |
359 |
|
|
{ "Ye", "=\bY", 0x00a5 }, |
360 |
|
|
{ "Po", "GBP", 0x00a3 }, |
361 |
|
|
{ "Cs", "o\bx", 0x00a4 }, |
362 |
|
|
{ "Fn", ",\bf", 0x0192 }, |
363 |
|
|
|
364 |
|
|
/* Units. */ |
365 |
|
|
{ "de", "<degree>", 0x00b0 }, |
366 |
|
|
{ "%0", "<permille>", 0x2030 }, |
367 |
|
|
{ "fm", "\'", 0x2032 }, |
368 |
|
|
{ "sd", "''", 0x2033 }, |
369 |
|
|
{ "mc", "<micro>", 0x00b5 }, |
370 |
|
|
{ "Of", "_\ba", 0x00aa }, |
371 |
|
|
{ "Om", "_\bo", 0x00ba }, |
372 |
|
|
|
373 |
|
|
/* Greek characters. */ |
374 |
|
|
{ "*A", "A", 0x0391 }, |
375 |
|
|
{ "*B", "B", 0x0392 }, |
376 |
|
|
{ "*G", "<Gamma>", 0x0393 }, |
377 |
|
|
{ "*D", "<Delta>", 0x0394 }, |
378 |
|
|
{ "*E", "E", 0x0395 }, |
379 |
|
|
{ "*Z", "Z", 0x0396 }, |
380 |
|
|
{ "*Y", "H", 0x0397 }, |
381 |
|
|
{ "*H", "<Theta>", 0x0398 }, |
382 |
|
|
{ "*I", "I", 0x0399 }, |
383 |
|
|
{ "*K", "K", 0x039a }, |
384 |
|
|
{ "*L", "<Lambda>", 0x039b }, |
385 |
|
|
{ "*M", "M", 0x039c }, |
386 |
|
|
{ "*N", "N", 0x039d }, |
387 |
|
|
{ "*C", "<Xi>", 0x039e }, |
388 |
|
|
{ "*O", "O", 0x039f }, |
389 |
|
|
{ "*P", "<Pi>", 0x03a0 }, |
390 |
|
|
{ "*R", "P", 0x03a1 }, |
391 |
|
|
{ "*S", "<Sigma>", 0x03a3 }, |
392 |
|
|
{ "*T", "T", 0x03a4 }, |
393 |
|
|
{ "*U", "Y", 0x03a5 }, |
394 |
|
|
{ "*F", "<Phi>", 0x03a6 }, |
395 |
|
|
{ "*X", "X", 0x03a7 }, |
396 |
|
|
{ "*Q", "<Psi>", 0x03a8 }, |
397 |
|
|
{ "*W", "<Omega>", 0x03a9 }, |
398 |
|
|
{ "*a", "<alpha>", 0x03b1 }, |
399 |
|
|
{ "*b", "<beta>", 0x03b2 }, |
400 |
|
|
{ "*g", "<gamma>", 0x03b3 }, |
401 |
|
|
{ "*d", "<delta>", 0x03b4 }, |
402 |
|
|
{ "*e", "<epsilon>", 0x03b5 }, |
403 |
|
|
{ "*z", "<zeta>", 0x03b6 }, |
404 |
|
|
{ "*y", "<eta>", 0x03b7 }, |
405 |
|
|
{ "*h", "<theta>", 0x03b8 }, |
406 |
|
|
{ "*i", "<iota>", 0x03b9 }, |
407 |
|
|
{ "*k", "<kappa>", 0x03ba }, |
408 |
|
|
{ "*l", "<lambda>", 0x03bb }, |
409 |
|
|
{ "*m", "<mu>", 0x03bc }, |
410 |
|
|
{ "*n", "<nu>", 0x03bd }, |
411 |
|
|
{ "*c", "<xi>", 0x03be }, |
412 |
|
|
{ "*o", "o", 0x03bf }, |
413 |
|
|
{ "*p", "<pi>", 0x03c0 }, |
414 |
|
|
{ "*r", "<rho>", 0x03c1 }, |
415 |
|
|
{ "*s", "<sigma>", 0x03c3 }, |
416 |
|
|
{ "*t", "<tau>", 0x03c4 }, |
417 |
|
|
{ "*u", "<upsilon>", 0x03c5 }, |
418 |
|
|
{ "*f", "<phi>", 0x03d5 }, |
419 |
|
|
{ "*x", "<chi>", 0x03c7 }, |
420 |
|
|
{ "*q", "<psi>", 0x03c8 }, |
421 |
|
|
{ "*w", "<omega>", 0x03c9 }, |
422 |
|
|
{ "+h", "<theta>", 0x03d1 }, |
423 |
|
|
{ "+f", "<phi>", 0x03c6 }, |
424 |
|
|
{ "+p", "<pi>", 0x03d6 }, |
425 |
|
|
{ "+e", "<epsilon>", 0x03f5 }, |
426 |
|
|
{ "ts", "<sigma>", 0x03c2 }, |
427 |
|
|
}; |
428 |
|
|
|
429 |
|
|
static struct ohash mchars; |
430 |
|
|
|
431 |
|
|
|
432 |
|
|
void |
433 |
|
|
mchars_free(void) |
434 |
|
|
{ |
435 |
|
|
|
436 |
|
25294 |
ohash_delete(&mchars); |
437 |
|
12647 |
} |
438 |
|
|
|
439 |
|
|
void |
440 |
|
|
mchars_alloc(void) |
441 |
|
|
{ |
442 |
|
|
size_t i; |
443 |
|
|
unsigned int slot; |
444 |
|
|
|
445 |
|
25294 |
mandoc_ohash_init(&mchars, 9, offsetof(struct ln, roffcode)); |
446 |
✓✓ |
8852900 |
for (i = 0; i < sizeof(lines)/sizeof(lines[0]); i++) { |
447 |
|
4413803 |
slot = ohash_qlookup(&mchars, lines[i].roffcode); |
448 |
✗✓ |
4413803 |
assert(ohash_find(&mchars, slot) == NULL); |
449 |
|
4413803 |
ohash_insert(&mchars, slot, lines + i); |
450 |
|
|
} |
451 |
|
12647 |
} |
452 |
|
|
|
453 |
|
|
int |
454 |
|
|
mchars_spec2cp(const char *p, size_t sz) |
455 |
|
|
{ |
456 |
|
|
const struct ln *ln; |
457 |
|
1362766 |
const char *end; |
458 |
|
|
|
459 |
|
681383 |
end = p + sz; |
460 |
|
681383 |
ln = ohash_find(&mchars, ohash_qlookupi(&mchars, p, &end)); |
461 |
✓✓✓✓
|
2736451 |
return ln != NULL ? ln->unicode : sz == 1 ? (unsigned char)*p : -1; |
462 |
|
681383 |
} |
463 |
|
|
|
464 |
|
|
int |
465 |
|
|
mchars_num2char(const char *p, size_t sz) |
466 |
|
|
{ |
467 |
|
|
int i; |
468 |
|
|
|
469 |
|
2124 |
i = mandoc_strntoi(p, sz, 10); |
470 |
|
1062 |
return i >= 0 && i < 256 ? i : -1; |
471 |
|
|
} |
472 |
|
|
|
473 |
|
|
int |
474 |
|
|
mchars_num2uc(const char *p, size_t sz) |
475 |
|
|
{ |
476 |
|
|
int i; |
477 |
|
|
|
478 |
|
22590 |
i = mandoc_strntoi(p, sz, 16); |
479 |
✗✓ |
11295 |
assert(i >= 0 && i <= 0x10FFFF); |
480 |
|
11295 |
return i; |
481 |
|
|
} |
482 |
|
|
|
483 |
|
|
const char * |
484 |
|
|
mchars_spec2str(const char *p, size_t sz, size_t *rsz) |
485 |
|
|
{ |
486 |
|
|
const struct ln *ln; |
487 |
|
75486 |
const char *end; |
488 |
|
|
|
489 |
|
37743 |
end = p + sz; |
490 |
|
37743 |
ln = ohash_find(&mchars, ohash_qlookupi(&mchars, p, &end)); |
491 |
✓✓ |
37743 |
if (ln == NULL) { |
492 |
|
336 |
*rsz = 1; |
493 |
|
336 |
return sz == 1 ? p : NULL; |
494 |
|
|
} |
495 |
|
|
|
496 |
|
37407 |
*rsz = strlen(ln->ascii); |
497 |
|
37407 |
return ln->ascii; |
498 |
|
37743 |
} |
499 |
|
|
|
500 |
|
|
const char * |
501 |
|
|
mchars_uc2str(int uc) |
502 |
|
|
{ |
503 |
|
|
size_t i; |
504 |
|
|
|
505 |
✓✓ |
1248066 |
for (i = 0; i < sizeof(lines)/sizeof(lines[0]); i++) |
506 |
✓✓ |
621810 |
if (uc == lines[i].unicode) |
507 |
|
1719 |
return lines[i].ascii; |
508 |
|
909 |
return "<?>"; |
509 |
|
2628 |
} |