rss

うーん、htmlって入れ子になってる場合の扱いが、なんか、parserって、タグで分割してるだけで、階層構造を認識してないっぽいので、あー、でもかいそうこうぞうをにんしきしてオブジェクト化してくれるのって、xmlパーサーか、でもそれだと、読み込みのとき、入れ子が変なhtml書いてる場合はなりたたないんだよな。要するに、rss生成の場合、頭を使うのは正規表現のところだけなんだけど、そこがいちばん難しいというか、テンプレートになにかを埋め込んでもらって正確に認識するようにするしかないのだろうか。いちおう、はてなtDiaryはそれなりにストリクトだし、スタイルシートのことを考えてclass属性がはいってるせいでかなりセマンティックだから楽なんだけど。それでも、

 なんで、終了タグはclass属性やid属性がないのだ。入れ子の認識が大変じゃないか。規格決めたやつでてこい。