この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "ジップの法則" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2016年7月) |
ジップの法則(ジップのほうそく、Zipf's law)あるいはジフの法則とは、出現頻度が k 番目に大きい要素が、1位のものの頻度と比較して 1/k に比例するという経験則である。Zipf は「ジフ」と読まれることもある。また、この法則が機能する世界を「ジフ構造」と記する論者もいる。
ジップの法則
確率密度関数 N = 10の両対数スケールのZipf確率密度関数。横軸は順位k。この関数はkの整数値のみについて定義されていることに注意。点間の接続線は連続であることを意味してはいない。) |
累積分布関数 N = 10のZipf累積分布関数。横軸は順位k。(この関数はkの整数値のみについて定義されていることに注意。点間の接続線は連続であることを意味してはいない。) |
母数 |
(実数)
(整数) |
---|
台 |
![{\displaystyle k\in \{1,2,\ldots ,N\}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2901de737533733105354dba92ef12fa5dfd444d) |
---|
確率密度関数 |
ここでHN,sはN番目の一般化調和数 |
---|
累積分布関数 |
![{\displaystyle {\frac {H_{k,s}}{H_{N,s}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cd2e24a4ad0920ceeda7e797e05e33f6034dd75a) |
---|
期待値 |
![{\displaystyle {\frac {H_{N,s-1}}{H_{N,s}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/de75685e9d5b89b2fddf89a37a83ae40511e795e) |
---|
最頻値 |
![{\displaystyle 1\,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bfd1e7984fe6e1b79a26404a8138a6c6ee41a476) |
---|
分散 |
![{\displaystyle {\frac {H_{N,s-2}}{H_{N,s}}}-{\frac {H_{N,s-1}^{2}}{H_{N,s}^{2}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/68f64ead5fcf58e79457f4e67cc56e48d6286d42) |
---|
エントロピー |
![{\displaystyle {\frac {s}{H_{N,s}}}\sum \limits _{k=1}^{N}{\frac {\ln(k)}{k^{s}}}+\ln(H_{N,s})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/17af26bab5f739c118963b1133c07e16f21e7d48) |
---|
モーメント母関数 |
![{\displaystyle {\frac {1}{H_{N,s}}}\sum \limits _{n=1}^{N}{\frac {e^{nt}}{n^{s}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5fa2db46adb6afa6c6488016a11cc754214a44ce) |
---|
特性関数 |
![{\displaystyle {\frac {1}{H_{N,s}}}\sum \limits _{n=1}^{N}{\frac {e^{int}}{n^{s}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f754ce96a12606a847ec97180f1f57c7a387dfac) |
---|
テンプレートを表示 |
ウィキペディア(30ヶ国語版)における単語の出現頻度
包括的な理論的説明はまだ成功していないものの、様々な現象に適用できることが知られている。この法則に従う確率分布(離散分布)をジップ分布という。ジップ分布はゼータ分布(英語版)の特殊な形である。
この法則はアメリカの言語学者ジョージ・キングズリー・ジップに帰せられている。ジップ以前に似た観察をしていた先行研究としてFelix Auerbach(英語版)、Jean-Baptiste Estoup(フランス語版)などの研究があり、ジップ自身もそのことを1942年の論文で紹介した[1]。
次のような様々な現象(自然現象、社会現象など)に成り立つ場合があることが確認されている:
一般のジップの法則は
-
(ただし N は全要素の数、k は順位)と書き表される。
ここで元来のジップの法則では s = 1 である。このとき N を無限大にすると分母は収束しない(無限大に発散する、「調和級数」を参照)ため、元来のジップの法則では N を有限としなければならない(現実にもそう考えられる場合が多い)。
ただし s が1より少しでも大きい実数ならば、N を無限大にしても分母は収束し(ゼータ関数 ζ(s) に等しい)、k の値を無限にとりうる分布関数とすることができる。
ジップの法則は冪乗則 (Power law) の一種である。また、ジップ分布は変数変換によりパレート分布(連続分布)と同じ形になることが示されている。パレート分布の離散型である。パレートの法則はパレート分布の特別な場合に当たり、また80-20の法則とも関係がある。順位規模の法則とも呼ばれる。