まずはデータ収集

なんか昔やったときは色々と細かな作業で大変だった記憶があったのですが
今はいいサイトも多いみたいであっさり過去データ見つかりました。

今回お世話になったのは
このサイト↓
http://www.geocities.co.jp/WallStreet-Stock/9256/data.html

上部に目的みたいのも記載してあり
======================
株価データ倉庫は、チャートソフトや過去の相場データを利用して独自の分析を行う為に必要な標準規格の
生データを提供する事を主目的とし、 同分野のソフトや独自の分析方法を開発しようとする個人を支援します。
======================
とのことでした。
まさに目的も一致しますし使っていいのだと思います。
大変ありがとうございました!!

このサイトのいいところは、
1年分の全銘柄のデータが一瞬でダウンロードできるところですね。

正直前回やった時に気になったのは
①期間
②銘柄
ですね。

自分は普通のPCとエクセル、アクセスでやっているので
データが多いと大変です。

データありすぎても意外と過去の結果より直近の結果を重視しがちなところもあり
7年あればいいかなとは思うのですが、
今回はとりあえず2007年からにしました(一応サブプライム考慮して入れて)

1年分だとテキストで100万行近くあるので銘柄は東証1部のみで絞ろうかと思います。
※後々の編集の為、エクセル1シートに入る範囲(100万行)にしたいからです。
(そのため状況次第では東証1部のデータを絞るかも。

と希望を書きましたが
今日の作業的には、

①ダウンロード
②ZIPデータの解凍(毎日のデータがzipでわかれているので、まとめて解凍)
③全テキストを結合(昔会社で作った、単純にテキストデータを結合するツールで結合)


ここまでやったら1年分のデータが100万近いことを知って減らさなきゃ・・・
と検討して、上記のようにしました。

ちなみに有料データであれば過去何年分のデータがキレイな形で手に入るようなサイトもありましたので
有料でもいいという方はそういう方法もあると思います。

ブログランキング


株式システムトレードランキング

※↑最後にポチッとして頂ければ励みになります<(_ _)>




シェアする

  • このエントリーをはてなブックマークに追加

フォローする