Python: ディープラーニングでビットコイン(BTC)の価格を予測するには〔６〕LSTMモデルをBotに組み込む【Deep Larning LSTM, Tensorflow, Python, Bitcoin, Bot】

ようこそ「Python」へ...

Python»記事(Article127) ◀前の記事次の記事▶

ディープラーニングでビットコイン(BTC)の価格を予測するには〔６〕LSTMモデルをBotに組み込む

ここでは６回に分けて仮想通貨ビットコイン(Bitcoin)の価格を予測する方法を解説します。このシリーズでは、ディープラーニングのLSTM(Long Short Term Memory)モデルを使用してビットコインの価格を予測します。

最終回の第６回目では、ディープラーニングのLSTMモデルをBOTに組み込んでGMOコインで実際に自動トレードしてみます。ここでは、本シリーズの第３回目で解説した手順でGMOコインの過去の取引データを元にビットコイン(BTC)、イーサリアム(ETH)、ライトコイン(LTC)の LSTMモデルを作成してファイルに保存しておきます。

BOTは、保存されたLSTMモデルを取り込んで未来の価格を予測して自動トレードのタイミングを判断します。

仮想通貨のBOTの作成方法は、以下の記事にて解説しています。BOTのソースコードも公開しているのでぜひチャレンジしてみてください。

説明文の左側に図の画像が表示されていますが縮小されています。画像を拡大するにはマウスを画像上に移動してクリックします。画像が拡大表示されます。拡大された画像を閉じるには右上の[X]をクリックします。画像の任意の場所をクリックして閉じることもできます。

LSTMモデルをBOTに組み込んでGMOコインで実際に自動トレードしてみる

まずは本シリーズの第３回目の「LSTMモデルを作成する」を参考にしてGMOコインのLSTMモデルを作成してファイルに保存する

ここでは、GMOコインからダウンロードした仮想通貨(BTC, ETH, LTC)の価格データを読み込んでLSTMのモデルを作成してファイルに保存します。 GMOコインから仮想通貨の価格データをダウンロードしてCSVファイルに保存する方法は、「BOT作成シリーズ(CSVクラス, APIクラス)」で解説しています。

Build LSTM Model.py:

# Build LSTM Model.py
#%%

### Import the libraires
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3'

import math
import numpy as np                
import matplotlib.pyplot as plt 
import matplotlib.dates as mdates
import pandas as pd             
import datetime as dt
from datetime import timedelta
from time import sleep

from sklearn.preprocessing import MinMaxScaler
from keras import models
from keras.layers import Dense, Dropout, LSTM
from keras.models import Sequential
from keras.models import load_model

from sklearn.metrics import mean_squared_error, mean_absolute_error, explained_variance_score, r2_score 
from sklearn.metrics import mean_poisson_deviance, mean_gamma_deviance, accuracy_score

import warnings
warnings.simplefilter('ignore')
plt.style.use('fivethirtyeight')

# %%

############################################
def get_data(csv_file: str) -> pd.DataFrame:
    print(f"Loading data for {symbol}: {csv_file} ")
    df = pd.read_csv(csv_file)       
    # price, side, size, timestamp    
    df['time'] = pd.to_datetime(df['timestamp'])            
    return df    

### Get the crypto data from the csv file
symbol = 'BTC_JPY'  # BTC_JPY, ETH_JPY, LTC_JPY 
csv_file = f"root/master({symbol}).csv" # root/master(BTC_JPY).csv
isFile = os.path.isfile(csv_file)
if not isFile:
    print(f"{csv_file} is not found => quit")
df = get_data(csv_file)

#%%

df.dropna(inplace=True)

### Check null values 
print('Null Values:', df.isnull().values.sum())         
print('If any NA values:', df.isnull().values.any())    

### Plot Line / Lag

plt.figure(figsize=(16,8))
plt.suptitle('Plots', fontsize=22)

plt.subplot(1,2,1)
df.set_index("time").price.plot()       # line chart
plt.title('Line Chart')

plt.subplot(1,2,2)
pd.plotting.lag_plot(df['price'], lag=1) # secondly lag
plt.title('Secondly Lag')

plt.show()

#%%

### Prepare Train / Test data 

### Create a new dataframe with only the 'price' column
close_df = df.filter(['price'])

### Convert filtered dataframe to a numpy array
close_ndarr = close_df.values   # N-dimension array : ndarray

### Get the number of rows to train the model on
prediction_days = int(close_ndarr.shape[0] * 0.2)     
train_len = len(close_ndarr) - prediction_days

### Split train and test 
train_ndarr = close_ndarr[0:train_len] 
test_ndarr = close_ndarr[train_len:]
   
### Plot train / test data
plt.figure(figsize=(13,7))
plt.plot(train_ndarr, label='Train', color='green')
plt.plot(test_ndarr, label='Test', color='red')
plt.title(f'{symbol} Train / Test Data', fontsize=18)
plt.xlabel('Time')
plt.ylabel('Close Price Yen (¥)')
plt.legend(['Train','Test'], loc='best')  
plt.show()

# %%

### Scale the train data & reshape  
scaler = MinMaxScaler(feature_range=(0,1))  
scaled_train_ndarr = scaler.fit_transform(train_ndarr)

### Split the data into x_train and y_train data sets
x_train = []    
y_train = []    

win_size = 60   # 5,10,30,60,... time series sequence length

for i in range(win_size, len(scaled_train_ndarr)):          # train_data (scaled data)    
    x_train.append(scaled_train_ndarr[i - win_size:i, 0])   # slice ndarray [start:stop,step]
    y_train.append(scaled_train_ndarr[i, 0])                # slice ndarray [start,step]     

### Convert the x_train and y_train to numpy arrays
x_train, y_train = np.array(x_train), np.array(y_train)

### Reshape the train data (scaled data)
x_train = np.reshape(x_train, (x_train.shape[0], x_train.shape[1], 1)) 

### Scale the test data & reshape

# scaler = MinMaxScaler(feature_range=(0,1))  
scaled_test_ndarr = scaler.fit_transform(test_ndarr)

### Split the test data into x_test and y_test data sets
x_test = []    
y_test = []    

for i in range(win_size, len(scaled_test_ndarr)):       # test_data (scaled data)    
    x_test.append(scaled_test_ndarr[i - win_size:i, 0]) # slice ndarray [start:stop,step]
    y_test.append(scaled_test_ndarr[i, 0])              # slice ndarray [start,step]   

### Convert the x_test and y_test to numpy arrays
x_test, y_test = np.array(x_test), np.array(y_test)

### Reshape the test data (scaled data)
x_test = np.reshape(x_test, (x_test.shape[0], x_test.shape[1], 1))  

# %%

### Build the LSTM model

model_path = f'root/lstm_model({symbol}).h5'   # root/lstm_model(BTC_JPY).h5
isFile = os.path.isfile(model_path)

if not isFile:
    model = Sequential()
    model.add(LSTM(units=128, activation='relu',return_sequences=True, input_shape=(x_train.shape[1], x_train.shape[2])))
    model.add(Dropout(0.2))
    model.add(LSTM(units=64, input_shape=(x_train.shape[1], x_train.shape[2])))
    model.add(Dropout(0.2))
    model.add(Dense(units=1))
    model.compile(optimizer='adam', loss='mean_squared_error')
    history = model.fit(
        x_train, y_train, 
        batch_size=32, 
        epochs=60, # 600, 100, 60, 30, 10
        verbose=1, 
        shuffle=False, 
        validation_data=(x_test, y_test)
        ) 

    plt.figure(figsize=(16,7))
    plt.plot(history.history['loss'], label='loss (train)')
    plt.plot(history.history['val_loss'], label='val_loss (test)')
    plt.legend()
    plt.title(f'{symbol} LSTM Loss vs Val_loss')
    plt.xlabel('Epochs')
    plt.ylabel('Loss')
    plt.legend(loc='best')    
    plt.show()          

    ### Save the model and architecture to single file
    model.save(model_path)
else:
    ### Load the LSTM model
    model = load_model(model_path)
# end of if not isFile:

### Print the model summary
model.summary()

# %%

図1-1ではビットコインの価格ファイル「master(BTC_JPY).csv」を取り込んで、PandasのDataFrameに格納しています。 DataFrameは「price, side, size, timestamp, time」の列（カラム）から構成されています。ここでは「price」のカラムのみ使用します。

図1-2では、DataFrameの先頭と最後のデータを５件づつ表示しています。「price」のカラムにはビットコイン(BTC)の価格が表示されています。 1BTCが約300万円の価格になっています。

図1-3ではDataFrameに不正(NaN: Not a Number)な値がないかチェックしています。「0」が表示されているので不正な値がないことが確認できました。グラフにはビットコインの価格を線グラフとラググラフに表示しています。ラググラフには秒単位の価格の散布図が表示されています。

図1-4ではビットコインの学習用データ(Train)と検証用データ(Test)をグラフに表示しています。学習用データと検証用データは「8:2」の比率で分割しています。

図1-5では学習用(Train)データと検証用(Train)データを[x,y」に分割したときの「データ形式: shape」を表示しています。学習用データには「12373」件のデータが格納されています。検証用データには「3048」件のデータが格納されています。ウィンドウ・サイズは「60」に設定しています。

図1-6では、LSTMモデルの学習時の欠損値をグラフで表示しています。欠損値はほぼ理想的な値になっていると思います。最後にLSTMモデルのサマリーを表示しています。

図1-7では、LSTMモデルを作成したらファイルに保存しています。 LSTMモデルは仮想通貨ごとに作成します。未来の価格を予測するときは、ここで保存したファイルをロードして行います。

BOT作成の第10回目と第11回目で解説したBOTのBuySellクラスとSellBuyクラスにLSTMモデルを組み込む

ここではBOT作成シリーズの第10回目「BOTのBuySellクラスを作成する」と第11回目「BOTのSellBuyクラスを作成する」で解説している、 BuySellクラスとSellBuyクラスにLSTMモデルを組み込んで未来の価格を予測します。

ここで予測した未来の価格は、未来のトレンドを判断するときに使います。

Add the LSTM Model into the Python Class Module.py:

# Add the LSTM Model into the Python Class Module.py
#%%

### Import the libraires
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3'

import math
import numpy as np                
import matplotlib.pyplot as plt 
import matplotlib.dates as mdates
import pandas as pd             
import datetime as dt
from datetime import timedelta
from time import sleep

from sklearn.preprocessing import MinMaxScaler
from keras import models
from keras.layers import Dense, Dropout, LSTM
from keras.models import Sequential
from keras.models import load_model

from sklearn.metrics import mean_squared_error, mean_absolute_error, explained_variance_score, r2_score 
from sklearn.metrics import mean_poisson_deviance, mean_gamma_deviance, accuracy_score

import warnings
warnings.simplefilter('ignore')
plt.style.use('fivethirtyeight')

# %%

################################### 
def get_trend(prices: list) -> str:
    trend = 0
    for i in range(1, len(prices)):
        if prices[i] > prices[i-1]:
            trend += 1
        elif prices[i] < prices[i-1]:
            trend -= 1
    return 'up' if trend > 0 else 'down'
  
############################################
def get_data(csv_file: str) -> pd.DataFrame:
    print(f"Loading data for {symbol}: {csv_file} ")
    df = pd.read_csv(csv_file)       
    # time,open,close,low,high,price,buy_price,side,size,symbol,psar,psar_trend,st,st_trend,ci    
    df['time'] = pd.to_datetime(df['time'])            
    return df    

### Load the Data
symbol = 'BTC_JPY'  # BTC_JPY, ETH_JPY, LTC_JPY 
csv_file = f"root/master_buy({symbol}).csv"  # root/master_buy(BTC_JPY).csv
isFile = os.path.isfile(csv_file)
if not isFile:
    print(f"{csv_file} is not found => quit")
df = get_data(csv_file)

#%%

### Prepare Train / Test data 

### Create a new dataframe with only the 'close' column
close_df = df.filter(['close'])

### Convert filtered dataframe to a numpy array
close_ndarr = close_df.values   # N-dimension array : ndarray

### Get the number of rows to train the model on
prediction_days = int(close_ndarr.shape[0] * 0.2)  
train_len = len(close_ndarr) - prediction_days

### Split train and test 
train_ndarr = close_ndarr[0:train_len] 
test_ndarr = close_ndarr[train_len:]

# %%

### Scale the train data & reshape  
scaler = MinMaxScaler(feature_range=(0,1))  
scaled_train_ndarr = scaler.fit_transform(train_ndarr)

### Split the data into x_train and y_train data sets
x_train = []    
y_train = []    

win_size = 60   # 5,10,30,60,... time series sequence length

for i in range(win_size, len(scaled_train_ndarr)):          # train_data (scaled data)    
    x_train.append(scaled_train_ndarr[i - win_size:i, 0])   # slice ndarray [start:stop,step]
    y_train.append(scaled_train_ndarr[i, 0])                # slice ndarray [start,step]     

### Convert the x_train and y_train to numpy arrays
x_train, y_train = np.array(x_train), np.array(y_train)

### Reshape the train data (scaled data)
x_train = np.reshape(x_train, (x_train.shape[0], x_train.shape[1], 1)) 

### Scale the test data & reshape
# scaler = MinMaxScaler(feature_range=(0,1))  
scaled_test_ndarr = scaler.fit_transform(test_ndarr)

### Split the test data into x_test and y_test data sets
x_test = []    
y_test = []    

for i in range(win_size, len(scaled_test_ndarr)):       # test_data (scaled data)    
    x_test.append(scaled_test_ndarr[i - win_size:i, 0]) # slice ndarray [start:stop,step]  
    y_test.append(scaled_test_ndarr[i, 0])              # slice ndarray [start,step]   

### Convert the x_test and y_test to numpy arrays
x_test, y_test = np.array(x_test), np.array(y_test)

### Reshape the test data (scaled data)
x_test = np.reshape(x_test, (x_test.shape[0], x_test.shape[1], 1))  

# %%

### Load the LSTM model
model_path = f'root/lstm_model({symbol}).h5'   # root/lstm_model(BTC_JPY).h5
isFile = os.path.isfile(model_path)

if not isFile:
    print(f"{model_path} file not found: quit python")
    quit()

model = load_model(model_path)

### Predict the future price
future_time = 10  # 3, 5, 7...
x_test_last_n_minutes  = x_test[-future_time:]   # [-10:]
predicted_n_minutes_prices = model.predict(x_test_last_n_minutes)
predicted_n_minutes_prices = scaler.inverse_transform(predicted_n_minutes_prices)
predicted_n_minutes_prices = np.array(predicted_n_minutes_prices)
predicted_n_minutes_prices = predicted_n_minutes_prices.flatten()

#%%

### Plot predicted prices
start_min = 1
time_list = [start_min + i for i in range(future_time)]

plt.figure(figsize=(16,7))
plt.plot(time_list, predicted_n_minutes_prices, marker='.', markersize=20, linewidth=1, label='Predected Future Price', color='red')
plt.title(f'{symbol} LSTM Model : Predict Future Price', fontsize=18)
plt.xlabel('Time (xticks + marker + annotate)')
plt.ylabel('Close Price Yen (¥)')
plt.legend(loc='best')
plt.xticks(time_list, [f'{t} min' for t in time_list], rotation=45)
for i, price in enumerate(predicted_n_minutes_prices):
    plt.annotate(f'¥{price:,.0f}', xy=(time_list[i], price), xytext=(5,5), textcoords='offset points', ha='center', va='bottom', color='green', fontsize=12)
plt.show()

trend  = get_trend(predicted_n_minutes_prices)

print(f"The trend of prices is {trend}")

# %%

図2-1ではビットコインの直近の価格データが格納されているCSVファイルを取り込んでPandasのDataFrameに格納しています。ここではビットコイン(BTC)の買い注文のファイルを取り込んでいます。 DataFrameは「time, open, close, low, high,...」等の列（カラム）から構成されますが、「close」のカラムのみ使用します。 GMOコインから仮想通貨の価格データをダウンロードしてCSVファイルに保存する方法は、「BOT作成シリーズ(CSVクラス, APIクラス)」で解説しています。

図2-2では、DataFrameの先頭と最後のデータを５件づつ表示しています。「close」にはビットコインの終値が格納されています。

図2-3では学習用データ(Train)と検証用データ(Test)のデータ形式(Shape)を表示しています。学習用データには4073件、検証用データには1018件のデータが格納されています。

図2-4では、学習用データと検証用データを「x, y」に分割したときのデータ形式(Shape)を表示しています。学習用データには4013件、検証用データには958件のデータが格納されています。

図2-5ではビットコインの直近の10件の終値(実価格)を表示しています。この価格を元にビットコインの未来の価格を予測します。

図2-6では、ビットコインの未来の価格をグラフに表示しています。グラフには未来の予測価格が１分単位で表示されています。最後に未来の予測価格のトレンド(up/down)を表示しています。ここでは「up」が表示されているのでLSTMモデルは価格が上昇すると判断していることになります。

BOTをシミュレーションモードとリアルモードで実行してみる
ここでは、Visual Studio Code (VS Code)を起動してBOTを実行してみます。 VS Codeの「Terminal」ウィンドウは複数開いています。「Terminal」ウィンドウの名前はマウスの右クリックで変更することができます。ここでは「MASTER, A-BTC, B-ETH, C-LTC」の名前に変更しています。上段の「A-BTC, B-ETH, C-LTC」はシミュレーションモード用のBOT、下段はリアルモード用のBOTを実行します。ちなみに、本番では10種類の性格(?)の異なるBOTを同時に実行させています。

先頭の「MASTER」はバックエンド用のプログラム(LoadMaster.py)を実行します。このプログラムは、GMOコインから仮想通貨(BTC, ETH, LTC)の価格データを24時間、365日取り込んでCSVファイルに保存します。

図3-1

図3-1では「MASTER」ウィンドウを表示しています。画面には、GMOコインから仮想通貨の価格データを取り込んでいるときのログが表示されています。ここでは、BTC_JPY, ETH_JPY, LTC_JPYの価格データを取り込んでいます。シンボルの「JPY」はレバレッジ用のデータを意味します。

図3-2

図3-2では、シミュレーションモード用の「A-BTC」ウィンドウを表示しています。このウィンドウには、ビットコイン(BTC_JPY)のレバレッジ取引のBOT(BOT3A)のログが表示されています。

図3-3

図3-3はGmailの画面です。注文が約定するとGmailに約定情報を送信します。メールの件名には「FAKE, REAL」の区分、約定した仮想通貨のシンボル「BTC_JPY, ETH_JPY, LTC_JPY」、「利益額」、約定した「時間」等が表示されます。

図3-4

メールの本文には、BOTのオプション、利益額、利益目標などが表示されます。本文には、仮想通貨毎の累計利益とすべての仮想通貨の合計利益額も表示されます。さらに、日次の目標利益額も表示されます。

ここでは日次の目標利益額が「2000円」に設定されています。目標が達成されるとBOTは自動トレードを終了します。

たとえば、月収９万円稼ぎたいときは、日次の目標利益を「3000円」に設定します。

図3-5

図3-5では、GMOコインのトップ画面を表示しています。この画面には仮想通貨の価格情報と損益額が表示されます。右端に「+3,170円」が表示されているので、BOTが3,170円稼いだことがわかります。

図3-6

図3-6ではGMOコインの取引情報を表示しています。この画面には「注文ID」が表示されるので注文毎の利益が分かります。

図3-7

図3-7の画面には日付ごとの損益情報が表示されます。

図3-8

図3-8ではBOTのログを表示しています。 BOTのログはテキストファイルに作成されます。ログを作成することにより、BUGが発生したときにBOTの処理をトレースすることができます。ここでは空売りの注文のログが表示されています。

「sell_buy(2)」では各種テクニカルインジケーターを利用して「空売り」のタイミングを判断します。ちなみに、「買い注文」は「buy_sell(2)」で行います。注文は「成行」「指値」どちらでも可能です。ここでは「成行」で注文しています。

「create_sell_order_market()」では「空売り」の注文を実行します。ここでは、「10LTC」の空売りを注文しています。 BOTには、注文時の最小単位として「5LTC」が設定されているので「5LTC」を２回に分けて実行しています。このログを見ると１回目の「5LTC」の注文が「3LTC, 1LTC, 1LTC」に分割されて約定しているのが分かります。２回目の「5LTC」の注文は分割されないで約定しています。ちなみに、「create_sell_order_market()」はすべての注文情報をCSVファイルに保存します。注文情報は３階層(注文ヘッダー、注文サブファイル、注文子ファイル)になっています。詳細は、後述します。

図3-9

図3-9では売りポジションの決済(買い戻し）のログを表示しています。「sell_buy(2)」では各種テクニカルインジケーターを利用して売りポジションの決済のタイミングを判断します。「create_buy_order_market()」では売りポジションの決済を行います。売りポジションの決済は「成行」「指値」どちらでも可能です。ここでは「成行」で決済しています。

「exe_buy_close_order_market()」が実行されていますが、これは売りポジションID毎に実行されます。「exe_buy_close_order_market(1,1), (1,2), (1,3)」が表示されていますが、これは数量「3LTC, 1LTC, 1LTC」に対して実行されています。

「exe_buy_close_order_market(2,1)」は、数量「5LTC」に対して実行されています。このように、売りポジションを決済するときは、「ポジションID + 数量」を１セットとして実行する必要があります。

図3-10

図3-10では、BOTが作成した注文の損益ファイルを表示しています。損益ファイルはExcelの形式で作成されます。「profit(AMT)」の列に注文ID毎の利益額が表示されています。ここでは「194+156=350円」の利益が出ていることがわかります。ちなみに、BOTは午前６時を経過したときにポジションを保持しているときは、自動的にレバレッジ手数料を計算して損益ファイルに追加します。このようにBOTは注文ID毎の損益を自動的に作成します。

図3-11

図3-11では「空売り注文」のCSVファイルをExcelで表示しています。注文ファイルは「ヘッダーファイル、サブファイル、子ファイル」の３階層で作成されます。上段のExcelファイルには、ヘッダーファイルが表示されています。このファイルには「sell_time, qty, price, real_qty, real_price,...」などが格納されます。

中段のExcelファイルには、サブファイルが表示されています。このファイルには「sell_time, sell_order_id, position_id, qty, price, real_qty, real_price,...」などが格納されます。

下段のExcelファイルには、子ファイルが表示されています。このファイルには「sell_time, sell_order_id, position_id, qty, price, real_qty, real_price,...」などが格納されます。

これらのCSVファイルを見ると数量がどのように分割されて約定しているかが分かります。売りポジションを決済するときは、子ファイルを元に決済(買い戻し）を行います。

図3-12

図3-12では「買い戻し注文」のCSVファイルをExcelで表示しています。注文ファイルは「ヘッダーファイル、サブファイル、子ファイル」の３階層で作成されます。上段のExcelファイルには、ヘッダーファイルが表示されています。このファイルには「buy_time, qty, price, real_qty, real_price,...」などが格納されます。

中段のExcelファイルには、サブファイルが表示されています。このファイルには「buy_time, buy_order_id, position_id, qty, price, real_qty, real_price,...」などが格納されます。

下段のExcelファイルには、子ファイルが表示されています。このファイルには「buy_time, buy_order_id, position_id, qty, price, real_qty, real_price,...」などが格納されます。

これらのCSVファイルを見ると数量がどのように分割されて約定しているかが分かります。サブファイルの「buy_order_id: 3215397700」に注目してください。この注文の数量は「qty: 5LTC」になっています。ところが子ファイルを見ると数量が「4LTC, 1LTC」に分割されて約定しています。まとめると、数量「10LTC」の空売りの注文が「1LTC」が６回と「4LTC」が１回に分割されています。このように数量が頻繁に分割されると約定したときのレートも変わるので利益率に影響を与えることになります。

ちなみに、この記事を読んでビットコインキャシュ(BCH)とリップル(XRP)は稼げないな・・・と閃いた人は、稼げるBotterです。何のことかよく分からないというBotterは稼げない人です。実は稼げるBotterかどうかはBOTを作る前から分かっています。なぜかと言えば、BOTにはBooterの投資に関する思考(考え方)がそのまま反映されるからです。なので、Booterが投資家としてどのような思考を持っているかが重要になります。稼げるBotterになるにはどのような思考を持てばよいかは、 BOTの作成シリーズの第12回目と第13回目の記事で詳しく解説します。また、なぜビットコインキャシュ(BCH)とリップル(XRP)では稼げないのか、その理由も解説します。