html2ms: more tags to ignore; the nbsp entity for space.
Reference: /n/sources/patch/applied/html2ms-more
Date: Tue Jan 3 13:42:34 CET 2012
Signed-off-by: yarikos@gmail.com
--- /sys/src/cmd/html2ms.c Tue Jan 3 13:35:58 2012
+++ /sys/src/cmd/html2ms.c Tue Jan 3 13:35:54 2012
@@ -82,6 +82,7 @@
"dd", g_ignore, g_unexpected,
"dfn", g_ignore, g_ignore,
"dir", g_list, g_listend,
+ "div", g_ignore, g_br,
"dl", g_indent, g_exdent,
"dt", g_dt, g_unexpected,
"em", g_ignore, g_ignore,
@@ -114,7 +115,9 @@
"plaintext", g_ignore, g_unexpected,
"pre", g_pre, g_displayend,
"samp", g_ignore, g_ignore,
+ "script", g_ignore, g_ignore,
"select", g_ignore, g_ignore,
+ "span", g_ignore, g_ignore,
"strong", g_ignore, g_ignore,
"table", g_table, g_tableend,
"textarea", g_ignore, g_ignore,
@@ -147,6 +150,7 @@
"aring", L'å', "atilde", L'ã', "auml", L'ä', "ccedil", L'ç', "eacute", L'é',
"ecirc", L'ê', "egrave", L'è', "eth", L'ð', "euml", L'ë', "gt", L'>',
"iacute", L'í', "icirc", L'î', "igrave", L'ì', "iuml", L'ï', "lt", L'<',
+"nbsp", L' ',
"ntilde", L'ñ', "oacute", L'ó', "ocirc", L'ô', "ograve", L'ò', "oslash", L'ø',
"otilde", L'õ', "ouml", L'ö', "szlig", L'ß', "thorn", L'þ', "uacute", L'ú',
"ucirc", L'û', "ugrave", L'ù', "uuml", L'ü', "yacute", L'ý', "yuml", L'ÿ',