読者です 読者をやめる 読者になる 読者になる

サイエンティストとマーケターのはざま

Pythonとか広告とかデータ分析とかとか


ヒストリカルデータから特定の為替ペアを抽出する

FX IPython Notebook Python

以前ダウンロードしたヒストリカルデータには複数の為替ペアが混ざっています。

まずヒストリカルデータに含まれる為替ペアをみてみましょう。

pandasを使って重複行を除去します。

In [12]:
 
data['<TICKER>'].drop_duplicates()
 
 
Out[12]:
0        AUDUSD
5864     AUDJPY
11718    USDCAD
17572    USDCHF
23434    CHFJPY
29293    EURUSD
35154    EURCAD
41014    EURCHF
46876    EURGBP
52733    EURJPY
58592    GBPUSD
64448    GBPCHF
70309    GBPJPY
76167    USDJPY
82023    XAGUSD
86839    XAUUSD
Name: <TICKER>, dtype: object 

上記の16種類の通貨ペアが含まれることがわかります。

次にこの中からドル円のレコードのみを抽出してみましょう。

In [7]:
 
data[data['<TICKER>']=='USDJPY']
 
 
Out[7]:
 <TICKER><DTYYYYMMDD><TIME><OPEN><HIGH><LOW><CLOSE>
76167 USDJPY 20010103 100000 114.60 114.60 114.37 114.44
76168 USDJPY 20010103 110000 114.45 114.64 114.38 114.64
76169 USDJPY 20010103 120000 114.62 114.62 114.36 114.37

特定のカラムの抽出したい文字列を指定してあげれば簡単に抽出できました。

他の通貨ペアも同様にしてあげれば問題なく抽出できます。

参考URL

簡単なデータ操作を Python pandas で行う - StatsFragments