ジップの法則
出典: フリー百科事典『ウィキペディア(Wikipedia)』
ジップの法則(-ほうそく、Zipf's law)とは、サイズがk 番目に大きい要素が全体に占める割合が 1 / k に比例するという経験則である。Zipfは「ジフ」と読まれることもある。
包括的な理論的説明はまだ成功していないものの、様々な現象に適用できることが知られている。この法則に従う確率分布(離散分布)をジップ分布という。
目次 |
[編集] 由来
元来は、アメリカの言語学者ジョージ・キングズリー・ジフ(George Kingsley Zipf)が英語の単語の使用頻度とその順位に関して発見した言語学の法則である。
[編集] 法則が成立する現象の例
次のような様々な現象(自然現象、社会現象など)に成り立つ場合があることが確認されている:
- 単語の使用頻度:言語全体だけでなく、例えば「ハムレット」など1作品中でも成り立つことが示されている。
- ウェブページへのアクセス頻度
- 都市の人口
- 上位3%の人々の収入
- 音楽における音符の使用頻度
- 細胞内での遺伝子の発現量
- 地震の規模
- 固体が割れたときの破片の大きさ
[編集] 数学的な定義
数学的には一般のジップの法則は
(ただしN は全要素の数、k は順位)と書き表される。
ここで元来のジップの法則ではs = 1 である。N を無限大にすると分母は収束しない(無限大に発散する)ため、元来のジップの法則ではN を有限としなければならない。
ただしs が1より少しでも大きい実数ならば、N を無限大にしても分母は収束し(ゼータ関数 ζ(s) に等しい)、k の値を無限にとりうる分布関数とすることができる。
[編集] 関連する概念
ジップの法則は冪乗法則(べきじょうほうそく、Power law)の一種である。また、ジップ分布は変数変換によりパレート分布(連続分布)と同じ形になることが示されている。パレートの法則はパレート分布の特別な場合に当たり、また80-20の法則とも関係がある。順位規模の法則とも呼ばれる。