2011-02-17から1日間の記事一覧

perlの文法2

perlの文法2 「use strict」 perlを書くときに推奨されている書き方。 メリットとしてはバグが減る。 (例えば変数宣言にはmyが必須になったり。) 、「スコープ (関数) 内でのみ有効な変数宣言」 をつけるべし! 「use Warning」 初期化されていない変数を…

TwitterのXデーをカウントダウンするサイト

CRC32でハッシュ化した数値の型をintにしてたら 全部2147483647 になった。。 int型の最大値が2147483647だそうな。 正しくはBIGINT使うか文字型?ちなみにtwitterの2147483647問題というのがあるらしい。 IDが超えると一部のアプリが使えなくなるそうな。…

本文抽出のアルゴリズム(メモ)

http://d.hatena.ne.jp/tarao/20090322#1237750634 から重要部部を転載。 自分用のメモです。 本文抽出のアルゴリズム1.明らかに要らないタグはそぎ落とす 2.HTMLを適当なブロック毎に分割 3.分割されたブロックにスコアをつける 4.つながってい…