2010-09-09から1日間の記事一覧

ExtractContentで本文抽出を試す。

http://d.hatena.ne.jp/naoya/20090911 ここで読んだはてなの本文抽出で使用されているという ExtractContent WEBの本文をperlを使って、抜き出すライブラリらしい。これまで自分のサイトなどでは、simple_html_dom.php を使って、HTMLをパースしたものを…