時系列分析の話とスクフェスイベントの簡易ボーダー予想法

お盆休みをはさんで下書きのまま放置しており,気付けばにこイベは終了…….
むしろ,次のイベが始まろうとしている今日この頃.
かと言って,書きかけの文章を消してしまうのはもったいないので,
ちょっと……というかかなり内容を修正しつつ投下.

時系列分析(予想/予測)についての話と,簡易ボーダー予想法について.

元タイトル「ボーダー予想 – ARIMAモデルとパーティクルフィルタ -」



関連:
[1] ソシャゲ(スクフェス)のボーダーを統計的に予測する方法-非定常時系列データ分析- (ケロ凛マラソン)
[2] スクフェスのボーダーを統計的に予測してみる(続き) – 時系列データ分析 – (絵里マカロン)
[3] スクフェスのボーダーを統計的に予測してみる(続き) のまとめ (絵里マカロン)





さて……ボーダー予想ガバガバと言われ……凹み中……(´・ω・`)
多少は仕方ないじゃん……(´;ω;`)ウッ…
(ちなみに,初期の頃はガバガバだったけど……
今はちゃんと最大誤差2,000以下まで来ているんだから……)

まあ……このままじゃいかんという事で,改めて良い予想はどうすれば良いかを考えてみる.

その前に,これまでの記事タイトルに誤りがあった事について訂正を.
当初はそこまで厳密に考えていなかったのですが,
真剣に考えるならば,その違いは非常に重要なので.

これまでのタイトルでは「予測」と言っていたけど,
この場合には厳密には「予想」が正しいのでこの場で訂正しておきます.

「予測(Prediction)」と「予想(Forecast)」は口語の上では区別されないけど,
時系列分析をする上で,データマイニングをする上では明確に区別し,
その違いを理解する事が非常に重要だと僕は思うのです.
これをしないから,或いはできないから,予測不可能学なんて考え方が出てくる.

金融データの話でもそうだけど,予測不可能という立場の人は,原因系と結果系を混同している.
それを考える上で,「予測」と「予想」の話が非常に重要になる.

ではその違いはなにか.

「予測」というのは原因系からモデルに基づいて将来の値を推定する事,
「予想」というのは結果系からモデルに基いて確率的に将来の値を推定する事.

一般に,原因系から結果系を推測するモデルを立てた場合,
この結果は「予測」であり,結果系から結果系を推測する場合,
それは「予想」である.

具体的な例としては,重回帰モデルは原因系である説明変数から結果系である
目的変数を説明するモデル(原因と結果の因果関係)を構築するが,
これによる将来値の推定は「予測」となる.
対して,結果系からARモデルにより,結果系一般を説明するモデルを構築する時,
これによる将来値の推定は「予想」となる.

「予測」は値と誤差の形で決定的に求める事ができるのに対して,
「予想」は値と誤差の形を確率的に求める事しかできないという大きな違いがある.
そして,それは一般に,原因系から結果の推定値を求めているのか,
結果系から結果の推定値を求めているのかという違いに拠る.
(勿論,原因系から確率的にしか求められない場合それは「予想」)

原因から結果を求める場合,原因と結果を結ぶ様なモデルが立てられれば,
原因に対して結果は一意に求めることができる為,決定論的な議論が可能になる.
結果から結果を求める場合,結果系からベイズ統計的に原因系を求め,
推測された原因系から結果系を求める事になる為,確率論的にしか議論できない.
っていう大きな違いがある.

そして,物事は往々にして「結果」は観測できるが「原因」は観測できない場合が多い.
その為,「予想」はできるが「予測」はできない場合が多い.
この時,「予想」と「予測」を厳密に定義し,明確に区別しなければ,
「予測不可能」で思考が停止してしまって,何もできなくなる.

そして,「予測」と違って「予想」というのは
非常に難しい事だっていうのが分かると思うのです.

はい……ここまで,精度が悪いとか,ガバガバだって言われた事への言い訳です.
言い訳だけど,これは本当に重要な事で,割と時系列分析や
データマイニングやっている人でさえ理解していない人が多い様に思うので,
改めて最初に書いておこうと思う.これ,本当に大事で,
コンセプチュアルフレームワークとして,これを持っているか持っていないかで,
時系列分析に於ける考え方や見通しが変わって来ると思うので.


さてさて,前置きが長くなったのですが,改めてボーダー予想をしたいと思う.
で,統計モデルを立てるのではなくて,簡易的にやる方法を考える.

毎度毎度,あーだこーだと統計だの何だのというのはどうだと,
欲しいのは結果であって,アカデミックである必要もなければ,
数理的背景だの難しい計算なんて必要無いんだ,という事で,
これまで6回分(スコアマッチ3回,マラソン3回)のデータから,
簡単に,そしてある程度しっかりとしたボーダー予想の方法を考えてみた.

正確さよりも簡易さを優先した予想式になっています.

計算式は2つで,1つは必達目標(コミットメント;最低目標)を,
1つは努力目標(ターゲット;安全圏目安)の目安になる.

-スコアマッチのボーダー簡易予想

●3枚取りボーダー予想計算式
必達目標計算式:平均累計pt/day x (イベント日数-1) + 初日累計pt
努力目標計算式:平均累計pt/day x (イベント日数+1)
(平均累計ptは最低2日以上,できれば3日以上で計算)
(大体5日目以降に計算すると確からしい結果が得られる)

●2枚取りボーダー予想計算式
必達目標計算式:平均累計pt/day x (イベント日数-1) + 初日累計pt x 4
努力目標計算式:平均累計pt/day x (イベント日数+2)
(平均累計ptは最低2日以上,できれば3日以上で計算)
(大体5日目以降に計算すると確からしい結果が得られる)

-マラソンのボーダー簡易予想

●3枚取りボーダー予想計算式
必達目標計算式:平均累計pt/day x (イベント日数-1) + 開始後3日間累計pt
努力目標計算式:平均累計pt/day x イベント日数 x 1.5

●2枚取りボーダー予想計算式
必達目標計算式:平均累計pt/day x (イベント日数-1) + 開始後3日間累計pt x 4
努力目標計算式:平均累計pt/day x イベント日数 x 2


これに基づいて,過去データをみてみると(5日分で計算),

・ことりイベ(マラソン)
3枚取り
必達目標:40,471
努力目標:50,101
実際の結果:47,005

2枚取り
必達目標:31,752
努力目標:34,334
実際の結果:31,917

・にこちゃんイベ(スコアマッチ)
3枚取り
必達目標:97,901
努力目標:106,198
実際の結果:99,886

2枚取り
必達目標:64,299
努力目標:64,978
実際の結果:63,888


という感じで,割と適当な結果が得られているんじゃないだろうか.
マラソンの方はEX解禁後傾きが倍近く変わるので,
どうしても簡易式を導出するのが難しい.
(指数モデルを立てると非常に当て嵌まりが良いけど簡易じゃないし)

結局,しっかりと予想したいならARIMAモデルが今の所良い感じだし,
適当に予想したいなら上の様な感じかなって思う.

次の真姫ちゃんイベでは

3枚取り予想ボーダー:45,000~48,000
2枚取り予想ボーダー:30,000~33,000

と思っているけど,今回やろうとしてできなかった事(モデリング)をやれればいいなって思う.
まあ,3枚取りに必至になっていて無理な可能性もありますが……\(^o^)/

カテゴリー: 統計学, 日記 パーマリンク

時系列分析の話とスクフェスイベントの簡易ボーダー予想法 への1件のフィードバック

  1. ピンバック: スクフェス スコア計算と今後の展望 – Darsein のスクフェスチャレンジ

コメントは受け付けていません。