|
Statistics`ContinuousDistributions`
このパッケージは,最も一般的に使用される連続分布へのアクセスを可能にし,連続分布の密度,平均,分散,その他の関連特性を計算することができる.分布はname[ , , ... ]という記号形式で表現される.統計分布の特性を与えるMeanのような関数は,引数として分布の記号表現を取る.
最も一般的に使用される分布には,正規分布(ガウス分布)から導出されたものもある.このような分布はNormalDistributionパッケージにも含まれている.正規分布,スチューデントt分布,カイ2乗分布,F比分布だけが必要なときは,このパッケージではなくNormalDistributionパッケージを使わなければならない.この4つの分布については,NormalDistributionセクションで詳細が説明されている.DiscreteDistributionsパッケージには多くの離散分布が含まれている.

正規分布から導出される一般的な分布

連続分布
一様分布UniformDistribution[min, max]は,一般的に矩形分布と呼ばれ,確率変数の値がどこでも均等に同様であるという特性を示す.一様に分布した確率変数の例として,minからmaxの線分上で無作為に選ばれた点の位置が挙げられる. が[ , ]上で一様に分布しているなら,確率変数 は , でコーシー (Cauchy) 分布CauchyDistribution[a, b]に従う.
対数正規分布LogNormalDistribution[mu, sigma]は,正規に分布した確率変数の指数が従う分布である.この分布は,多くの独立した確率変数が乗法的に結合される場合に起る.半正規分布HalfNormalDistribution[theta]は領域[0, )に限定された分布NormalDistribution[0, 1/(theta Sqrt[2/Pi])]に比例する.
で のとき,ガンマ分布GammaDistribution[alpha, lambda]は 単位の正規確率変数の平方和の分布を描く.この形式のガンマ分布は,自由度 のカイ2乗分布と呼ばれる. のとき ,ガンマ分布は指数分布ExponentialDistribution[lambda]の形式を取る.これはイベント間の待ち時間の記述によく使われる.
カイ分布ChiDistribution[n]は,カイ2乗確率変数の平方根が従う分布である. のときは,カイ分布は のHalfNormalDistribution[theta]と等しい. のときは,カイ分布は のレイリー (Rayleigh) 分布RayleighDistribution[sigma]と等しい.
と が,尺度母数が等しい別々のガンマ分布であるとき,確率変数 はベータ分布BetaDistribution[alpha, beta]に従う.ここで と はガンマ変数の形状母数である.
ワイブル (Weibull) 分布WeibullDistribution[alpha, beta]は,物体の寿命を記述するために工学で広く使われている.極値分布ExtremeValueDistribution[alpha, beta]は,正規分布を含む多様な分布から抽出された大きい標本における最小あるいは最大値に限った分布である.極値分布はワイブル分布した確率変数の対数の分布を描くので,対数ワイブル分布と呼ばれることもある.
ラプラス (Laplace) 分布LaplaceDistribution[mu, beta]は,同一の指数分布を持つ2つの独立した確率変数の差の分布である.ロジスティック分布LogisticDistribution[mu, beta]は裾の長い分布を望む場合に,正規分布の代りに頻繁に使われる.
パレート分布 (Pareto) 分布ParetoDistribution[k, alpha]は収入を表すために使われる. は最小の収入を示す.

非心パラメータでの分布
平均がゼロではない正規分布から導出された分布は,非心分布と呼ばれる.
分散が で平均がゼロではない,正規分布した 個の確率変数の平方和は非心カイ2乗分布NoncentralChiSquareDistribution[n, lambda]に従う.非心パラメータ は,合計の確率変数の平均の平方和である.文献によっては あるいは が非心パラメータとして使われていることに注意する.
非心スチューデントt分布NoncentralStudentTDistribution[n, lambda]は比 を示す.ここで は自由度 の中心カイ2乗確率変数で, は分散が で平均が の独立した正規分布の確率変数である.
非心F比分布NoncentralFRatioDistribution[ , , lambda]は,自由度 の中心カイ2乗確率変数に対する,非心パラメータ ,自由度 の非心カイ2乗確率変数の比の分布である.

分布の関数
における累積分布関数(cdf)は までの確率密度関数(pdf)の積分によって与えられる.従ってpdfは一般的な意味でcdfを微分することによって得られる.このパッケージでは,分布は記号形式で与えられる.PDF[dist, x]は が数値であれば における密度を評価し,数値でなければ関数を記号形式のままにしておく.同様にCDF[dist, x]は累積密度を与える.Domain[dist]はPDF[dist, x]とCDF[dist, x]の領域を与える.
分位数Quantile[dist, q]は効率的にcdfの逆である.これはCDF[dist, x]が に達するときの の値を与える.中央値はQuantile[dist, 1/2]によって与えられる.四分位数,十分位数,百分位数も分位数として表すことができる.分位数は統計パラメータの信頼区間を構築するときに使われる.
平均Mean[dist]は に従って分布した確率変数の期待値であり,通常 と表記される.平均は によって与えられる.ここで とは分布のpdfである.分散Variance[dist]は によって与えられる.分散の平方根は標準偏差と呼ばれ,通常 で表記される.
Skewness[dist]とKurtosis[dist]の両関数は,それぞれ分布の非対称度と尖鋭を要約する形状の統計を与える.歪度は によって,尖度は によって与えられる.
特性関数CharacteristicFunction[dist, t]は によって与えられる.離散の場合は, となる.各分布にはそれぞれ固有の特性関数があり,分布を定義するためにpdfの代りに使用されることもある.
Random[dist]は指定された分布から擬似乱数を与える. Mathematica ブックの擬似乱数のセクションの記述通り,Randomの他の組込み形式のように種(シード)とともに使うことができる.
パッケージをロードする.
In[1]:= <<Statistics`ContinuousDistributions`
形状母数が3,尺度母数が1のガンマ分布の記号表現である.
In[2]:= gdist = GammaDistribution[3, 1]
Out[2]= 
10で評価された累積分布関数である.
In[3]:= CDF[gdist, 10]
Out[3]= 
以下がその累積分布関数である.組込み関数のGammaRegularizedによって与えられる.
In[4]:= cdfunction = CDF[gdist, x]
Out[4]= 
累積分布関数のプロットである.
In[5]:= Plot[cdfunction, {x, 0, 10}]

Out[5]= 
ガンマ分布に従って分布した要素を持つ擬似配列である.
In[6]:= RandomArray[gdist, 5]
Out[6]= 
|