久し振りに見た目にわかる修正(わかんないかもしれないけど)。
リンク付きのimgタグは、これまでは無条件に、「+」記号に画像ファイルへのリンクを付けてきたのだけど、リンクなしの場合と同じ条件のものはこれがなくなりました。またimg altがない場合、imgを囲むaにtitle属性があればその値を表示文字列にするようにしました(それもなければ従来通りimg srcのファイル名)。
hrefがないか(a nameなど)、http|https|mailto|tel|telto以外のプロトコル(javascriptなど)のaタグは除去するようにしました(子要素の文字列のみを表示)。なお、a nameはフラグメント識別子をクエリーで扱うようにしちゃったので不要になっていたため。
ついで。
とか書いてたら「あれ?これDOMでやったほうがいいんじゃん?」とか思い、忘れた頃にしばしばこんなことを思い始めるので自分用のメモ。DOMを採用しない理由は、ひとさまが書いたHTMLを扱う限り、そのHTMLがDOMできちんと扱える構造になっているとは限らないためです。
2005/09/15