【鉄獣戦線 徒花のフェリジット】メルカリ相場の価格分布はやはり正規分布っぽくない話(前編)【遊戯王】
イントロ.今回の調査内容
こんにちは、たちつてとです。
いつぞやの鉄獣戦線 徒花のフェリジット(以下、フェリ or フェリさん)の統計調査の続き?
みたいな感じです。
|
|
結論書くと、タイトル通りなんですが、最近、正規性や検定というワードを知りまして。
Q-QプロットとかShapiro-Wilk検定、Kolmogorov-Smirnov検定というものをやってみました。
あ、待ってください。ブラウザバックしないで...
Q-Qプロットはともかく、他二つは僕も理解というか証明というかはできていません。
多分、導出が大変なんでしょう。まあ、ゆっくりしていってください。
最初の調査↓
tachitutetonosuke.hatenablog.com
続編↓
tachitutetonosuke.hatenablog.com
ほいで、今回は下の方の記事の続きといえるんでしょうか。
↑後編の記事で、フェリさんのメルカリ相場の度数分布を見てたんです。
なんか正規分布っぽくなくね。みたいな話をしてたんですが、
それに数学としてのお墨付きをもらえる方法を見つけたので、紹介します。
(やっぱ、勉強するって大事や...)なお、お墨付きをもらえる記事は長くなったので別記事に...
Q-Qプロット
はい、↓図はQ-Qプロットと呼ばれるものです。
・黒い◯点が実験データで、
・図左側の下限:7000から側上限:15000くらいまでに
伸びている青い線がもし正規分布だったら、という直線
です。は?どういうこと、正規分布って山型のアレやろ?となるんですが、
「どうやったらこの図が書けるか」は、この際置いときます。
問題は、この図をどう見ると、何を判断できるか、です。
これも結論をかくと、
黒い◯点と青い線が合っていれば
黒い◯点は正規分布にしたがっている
って見た目で判断できる方法なんです!いやあ、統計学にわかには優しい。
しかし、これ見て誰もが同じ感想を思うはず。
横軸1くらいを境目にして、全然ちゃうやんけ!!!
僕もそう思いました。↓誰も覚えてないと思うので、フェリさんの金額度数分布。
高価格帯に分布がダラダラ続いている様相です。
Q-Qプロットで、青線と全然違うのはこの高価格帯なんです。
(高価格帯が一定数存在するのは、「ランク」9,10(←カードの美しさを決めます。10はやばい。)の出品があるからです。もちろん、相場無視で売れ残ってるやつもあるんすけどね笑)
正規分布って、頂点を超えた後は単調減少する分布なんです。
一方、↑のフェリさん分布は、15500円くらいのところで分布が落ち着いたかと思うと、
26000円くらいのとこで、ピクンと上がる、また29500円くらいのところで、ピクン...と、
往生際が悪いんです。
ですから、Q-Qプロット全然ちゃうやんけ!!!は望むところなんですね。
Q-Qプロット詳細編
ほい、そんなわけで↑高価格帯をのぞいてみました。
縦軸の範囲に注意です!6000円から18000円くらいのみをピックアップ。
ここは判断が分かれるところかもしれませんね...はっきり言って微妙すぎる。
グラフィカルな判定はやはり厳しい...
個人的には、合ってないやろ!にかけたいところ。
よく見ると、横軸が-3〜-1のところまでは全然合ってないし、-1〜0.5くらいのところにかけては、
青い線より下側に黒◯点が来ているように見えます。
はい、そんなわけでフェリさんメルカリ相場分布は
正規分布ではない!!!
次回、Shapiro-Wilk検定、Kolmogorov-Smirnov検定でお墨付きをもらいます。(2021/09/06時点でのデータを参照してます)
【補足】
横軸の説明。
正直、今回見た目としてどうかということだけにQ-Qプロットを利用するのであんまり深く立ち入らないんですが。
要は、横軸は金額が3σくらいのとこまでをプロットしてます。
・横軸の0は何かというと、平均値のある位置です。このデータでは、平均値=12000円くらいなので
縦軸の金額= 12000円くらいのところで、ちょうどこのあたりに横軸の0が来ています。
・横軸の(-)1,2,3は、シグマ(=標準偏差)横軸の(-)σ,2σ,3σのことです。
【補足ここまで】
右下の書籍を読んでいて、標本集団が正規分布にしたがっているか検定できる方法がある
みたいなことが書いてありました。簡単に触れてるだけでいまいちぴんとこず、
ネットでググってみたのがきっかけでした。
統計学入門では、正規分布に従うという仮定で前に進んでいくのが、
初等的?一般的?なんかと思います。右下の入門統計学は、割と網羅的でいい本だと思います。
|
|
||
|
|