2013年7月25日

html2jsonml

https://bitbucket.org/oov/html2jsonml

HTML から JsonML に変換するツールを作った。
JSON が処理できる環境ならこれで簡単に HTML を分解処理できて便利。だと思う。

Go 言語の HTML パーサは HTML5 のルールに従っているらしいので DOCTYPE 宣言の前に script タグが出てくるとか、HTML タグが2回始まってるとか、「色々 HTML 側が頭おかしくてもブラウザが表示できてるからセーフ」っていう類の書き間違いは大体上手く処理できるんじゃなかろうか。
Clip to Evernote