html2ms: more tags to ignore; the nbsp entity for space. Reference: /n/sources/patch/applied/html2ms-more Date: Tue Jan 3 13:42:34 CET 2012 Signed-off-by: yarikos@gmail.com --- /sys/src/cmd/html2ms.c Tue Jan 3 13:35:58 2012 +++ /sys/src/cmd/html2ms.c Tue Jan 3 13:35:54 2012 @@ -82,6 +82,7 @@ "dd", g_ignore, g_unexpected, "dfn", g_ignore, g_ignore, "dir", g_list, g_listend, + "div", g_ignore, g_br, "dl", g_indent, g_exdent, "dt", g_dt, g_unexpected, "em", g_ignore, g_ignore, @@ -114,7 +115,9 @@ "plaintext", g_ignore, g_unexpected, "pre", g_pre, g_displayend, "samp", g_ignore, g_ignore, + "script", g_ignore, g_ignore, "select", g_ignore, g_ignore, + "span", g_ignore, g_ignore, "strong", g_ignore, g_ignore, "table", g_table, g_tableend, "textarea", g_ignore, g_ignore, @@ -147,6 +150,7 @@ "aring", L'å', "atilde", L'ã', "auml", L'ä', "ccedil", L'ç', "eacute", L'é', "ecirc", L'ê', "egrave", L'è', "eth", L'ð', "euml", L'ë', "gt", L'>', "iacute", L'í', "icirc", L'î', "igrave", L'ì', "iuml", L'ï', "lt", L'<', +"nbsp", L' ', "ntilde", L'ñ', "oacute", L'ó', "ocirc", L'ô', "ograve", L'ò', "oslash", L'ø', "otilde", L'õ', "ouml", L'ö', "szlig", L'ß', "thorn", L'þ', "uacute", L'ú', "ucirc", L'û', "ugrave", L'ù', "uuml", L'ü', "yacute", L'ý', "yuml", L'ÿ',