データを絞ろう!

前回紹介したサイトの話になってしまうのですが、
データが以下のようになってます。

=========================================
20080104
1001 日経225 15155 15156 14542 14691 142.834
1002 東証指数 1461 1461 1403 1411 142.834
1003 NY円相場 10845 10845 10845 10845 0



20080105
1001 日経225 15155 15156 14542 14691 142.834
1002 東証指数 1461 1461 1403 1411 142.834
1003 NY円相場 10845 10845 10845 10845 0
=========================================
そう、データベースに入れる際に日付が横列にないので
データに日付を入れる必要があります。

=========================================
20080104 1001 日経225 15155 15156 14542 14691 142.834
20080104 1002 東証指数 1461 1461 1403 1411 142.834
20080104 1003 NY円相場 10845 10845 10845 10845 0



20080105 1001 日経225 15155 15156 14542 14691 142.834
20080105 1002 東証指数 1461 1461 1403 1411 142.834
20080105 1003 NY円相場 10845 10845 10845 10845 0
=========================================
↑こんな感じ

ということで、
エクセルに全部貼り付けて、
=IF(B2=””,A2,H1)

のような関数で日付を付けました!
※値を設定したら重くなるので関数から値に変換しておくのは大事ですね。

でデータが多いので
他のシートに取得銘柄コードを入れて、
VLOOKUPで厳選!

そのため、東証1部の銘柄を調べると・・・
2000近くあるんですね。

前にやった時は1000銘柄ぐらいだったのですが、
それでも多かったかな?と思っていたので今回はもう少し減らしたいと思っていました。

でさらに調べると

TOPIX CORE30
TOPIX Large70
TOPIX Mid400
TOPIX Small 1
TOPIX Small 2

という区分けがあるようですね。
上から重要銘柄を指しているようで、
今回は上の3つを採用としました!
※ちょうど500ぐらいで希望とマッチです。

VLOOKUPで絞ってみると
大体11万件ぐらいでした。

1年が11万件
11年で120万ぐらい・・・
シートには入りませんが2シートにすればいいかな?
ということでこれでやっていこうかと思います。

今日はこのあたりにしてまた明日2008年から量産したいと思います!

ブログランキング


株式システムトレードランキング

※↑最後にポチッとして頂ければ励みになります<(_ _)>




シェアする

  • このエントリーをはてなブックマークに追加

フォローする