前の記事 ≪:Photoshop&Illustratorのキラーチュートリアル53
次の記事 ≫:PHPでタグクラウド実装サンプル

JavaScript単体で動作するHTMLパーサー

2008年05月07日-はてなブックマーク

スポンサード リンク
[PR] 英単語を忘却曲線アプリを使って超効率よく記憶する方法

John Resig - Pure JavaScript HTML Parser

JavaScript単体で動作するHTMLパーサー。
JavaScript単体で、HTMLをパースしてXMLに変換するデモも公開されています。

次のように、閉じていなかったり、不正なHTMLを正すことが可能です。
JavaScriptでの実装のため、クライアントサイドでこの処理が可能になります。

例1)
<b>Hello <p>John

<b>Hello </b><p>John</p>

例2)
<a href=">aaa

<a href=""">aaa</a>

HTMLtoDOM関数で、HTMLをDOMに変換することも可能みたい。
JavaScriptでスクレイピングしたりできそうですね。

関連エントリ

関連の記事検索:HTML, パーサー, xml
スポンサード リンク

By.KJ : 2008年05月07日 10:08 livedoor Readerで購読 Twitterに投稿

間違いの指摘をしていただける方はメール、あるいはTwitter/FBでお願いします(クリック)