つてとのブログ

【鉄獣戦線 徒花のフェリジット】メルカリ相場の価格分布はやはり正規分布っぽくない話(前編)【遊戯王】

 

イントロ.今回の調査内容

こんにちは、たちつてとです。

いつぞやの鉄獣戦線 徒花のフェリジット(以下、フェリ or フェリさん)の統計調査の続き?

みたいな感じです。

結論書くと、タイトル通りなんですが、最近、正規性や検定というワードを知りまして。

Q-QプロットとかShapiro-Wilk検定、Kolmogorov-Smirnov検定というものをやってみました。

あ、待ってください。ブラウザバックしないで...

Q-Qプロットはともかく、他二つは僕も理解というか証明というかはできていません。

多分、導出が大変なんでしょう。まあ、ゆっくりしていってください。

 

最初の調査↓

tachitutetonosuke.hatenablog.com

続編↓

tachitutetonosuke.hatenablog.com

 

 

ほいで、今回は下の方の記事の続きといえるんでしょうか。

↑後編の記事で、フェリさんのメルカリ相場の度数分布を見てたんです。

なんか正規分布っぽくなくね。みたいな話をしてたんですが、

それに数学としてのお墨付きをもらえる方法を見つけたので、紹介します。

(やっぱ、勉強するって大事や...)なお、お墨付きをもらえる記事は長くなったので別記事に...

Q-Qプロット

はい、↓図はQ-Qプロットと呼ばれるものです。

f:id:tachitutetoNosuke:20210912091331p:plain

・黒い◯点が実験データで、

・図左側の下限:7000から側上限:15000くらいまでに

 伸びている青い線がもし正規分布だったら、という直線

 

です。は?どういうこと、正規分布って山型のアレやろ?となるんですが、

「どうやったらこの図が書けるか」は、この際置いときます。

問題は、この図をどう見ると、何を判断できるか、です。

 

これも結論をかくと、

 

黒い◯点と青い線が合っていれば

黒い◯点は正規分布にしたがっている

 

って見た目で判断できる方法なんです!いやあ、統計学にわかには優しい。

しかし、これ見て誰もが同じ感想を思うはず。

 

横軸1くらいを境目にして、全然ちゃうやんけ!!!

 

僕もそう思いました。↓誰も覚えてないと思うので、フェリさんの金額度数分布。

f:id:tachitutetoNosuke:20210912151703p:plain

高価格帯に分布がダラダラ続いている様相です。

Q-Qプロットで、青線と全然違うのはこの高価格帯なんです。

(高価格帯が一定数存在するのは、「ランク」9,10(←カードの美しさを決めます。10はやばい。)の出品があるからです。もちろん、相場無視で売れ残ってるやつもあるんすけどね笑)

正規分布って、頂点を超えた後は単調減少する分布なんです。

一方、↑のフェリさん分布は、15500円くらいのところで分布が落ち着いたかと思うと、

26000円くらいのとこで、ピクンと上がる、また29500円くらいのところで、ピクン...と、

往生際が悪いんです。

ですから、Q-Qプロット全然ちゃうやんけ!!!は望むところなんですね。

 

Q-Qプロット詳細編

f:id:tachitutetoNosuke:20210912101347p:plain

ほい、そんなわけで↑高価格帯をのぞいてみました。

縦軸の範囲に注意です!6000円から18000円くらいのみをピックアップ。

 

ここは判断が分かれるところかもしれませんね...はっきり言って微妙すぎる。

グラフィカルな判定はやはり厳しい...

 

個人的には、合ってないやろ!にかけたいところ。

よく見ると、横軸が-3〜-1のところまでは全然合ってないし、-1〜0.5くらいのところにかけては、

青い線より下側に黒◯点が来ているように見えます。

 

はい、そんなわけでフェリさんメルカリ相場分布は

正規分布ではない!!!

 

次回、Shapiro-Wilk検定、Kolmogorov-Smirnov検定でお墨付きをもらいます。(2021/09/06時点でのデータを参照してます)

【補足】

横軸の説明。

正直、今回見た目としてどうかということだけにQ-Qプロットを利用するのであんまり深く立ち入らないんですが。

要は、横軸は金額が3σくらいのとこまでをプロットしてます。

 

・横軸の0は何かというと、平均値のある位置です。このデータでは、平均値=12000円くらいなので

縦軸の金額= 12000円くらいのところで、ちょうどこのあたりに横軸の0が来ています。

 

・横軸の(-)1,2,3は、シグマ(=標準偏差)横軸の(-)σ,2σ,3σのことです。

【補足ここまで】

 

右下の書籍を読んでいて、標本集団が正規分布にしたがっているか検定できる方法がある

みたいなことが書いてありました。簡単に触れてるだけでいまいちぴんとこず、

ネットでググってみたのがきっかけでした。

統計学入門では、正規分布に従うという仮定で前に進んでいくのが、

初等的?一般的?なんかと思います。右下の入門統計学は、割と網羅的でいい本だと思います。