文字実体参照
& みたいなのは文字実体参照というらしい。次のサイトとか、HTMLの定義を辿ると、ISO-8859-1だけじゃなくて、それ以外にもたっぷりあるのね。。
- HTML文書の表現 ( http://www.asahi-net.or.jp/~sd5a-ucd/rec-html401j/charset.html )
- 24 HTML 4の文字実体参照 ( http://www.asahi-net.or.jp/~sd5a-ucd/rec-html401j/sgml/entities.html )
- 24 Character entity references in HTML 4 ( http://www.w3.org/TR/1999/REC-html401-19991224/sgml/entities.html )
ということで、これらも考慮したほうが良いな...。