【論文解説】「リフォースメントラーニングに統合されたテクニカル指標と出来高確認の高度な組み合わせを活用したスマート株取引」

今回は、Posted: 12 Aug 2025に掲載された「リフォースメントラーニングに統合されたテクニカル指標と出来高確認の高度な組み合わせを活用したスマート株取引」の論文を分かりやすく解説・要約しました。

元の論文は下記の通りです。
Smart Stock Trading using an Advanced Combination of Technical Indicators with Volume Confirmation Integrated in Reinforcement Learning
出典元:SSRN

それでは早速見ていきましょう。

DMM FX

株式取引のための技術指標とボリューム確認を組み合わせた高度な組み合わせを活用したスマート株式取引:強化学習に統合

概要

本研究は、従来の技術分析と最先端の強化学習を統合し、株式市場での取引体験を向上させ、より高い収益を生み出すことに焦点を当てています。Simple Moving Average(SMA)のクロスオーバーをAverage Traded Volume(ATV)およびRelative Strength Index(RSI)の確認と組み合わせることで、市場予測レベルを向上させ、取引戦略を自動化することを目指しています。National Stock Exchange(NSE)に上場している10の大型株の過去データでのバックテストでは、さまざまな時間枠で高い精度とReturn on Investment(RoI)を示し、有望な結果を示しています。

イントロダクション

株式市場は経済において重要な役割を果たしており、多くの人々が取引に直接的または間接的に関与しています。本研究では、SMAクロスオーバー、ATV、RSIなどの技術指標を強化学習と統合し、自動取引戦略を開発するシステムを提案しています。機械学習アルゴリズムを活用することで、意思決定を強化し、収益性の高い取引シグナルを生成することを目指しています。

文献レビュー

文献レビューでは、異なる技術指標を組み合わせることの重要性が強調されています。SMAクロスオーバーのパフォーマンス、ATVとRSIの取引戦略への統合、強化学習ベースのMLモデルの展開が、自動取引シグナルの生成においてどれほど有効であるかが示されています。研究は、株式取引における精度と収益性を向上させるために複数の指標を組み合わせる必要性を強調しています。

データと変数

概要

この研究は、MLアルゴリズムをSMAクロスオーバー、ATV、RSIのような信頼性の高い技術指標と組み合わせて、株式市場の自動取引戦略を開発・評価することに焦点を当てています。歴史的な株価データと出来高データを使用して、システムをトレーニングし、制御された環境でそのパフォーマンスをテストしています。

データ取得と処理

モデルは、Yahoo Financeや公式取引所のウェブサイトなどのソースからライブおよび歴史的な株式市場データを取得しています。データにはOHLC(オープン、ハイ、ロー、クローズ)価格やTraded Volume(TV)データが含まれます。株価の操作を最小限に抑えるために、流動性の高い大型株が分析の対象とされています。選択した大型株において、長期、中期、短期の取引シグナルを生成するために5年、1年、1か月にわたる歴史データが考慮されています。

データ前処理とクリーニング

セキュリティ市場の休日は、連続した時系列データにおける主要な問題を引き起こし、欠損値が割り当てられます。この問題を克服するために、モデルにはデータの連続性を確保するための前方補完(ffill)アルゴリズムが組み込まれています。余分な列を排除するために、調整価格がAdj Close列で使用されます。時間ベースのデータ系列に対して、OLHCデータは日時形式に変換されます。

方法論とモデル仕様

特徴エンジニアリング

Simple Moving Averages(SMA)は、株価の歴史的な終値の平均を取ることで価格動向のトレンドを検出する技術分析指標です。SMAは短期のボラティリティの問題を克服し、良好なトレンド予測を提供します。
複数のSMAラインは、50日SMAなど異なる時間枠で単一のウィンドウ内に生成することができます。

クロスオーバー戦略

SMAクロスオーバー戦略は、2つのSMA間の相関に基づいてエントリーシグナルとエグジットシグナルを決定するために、アルゴリズム取引や手動取引で頻繁に使用されます。短期SMAが長期SMAを上回るか下回ると、ゴールデンクロスオーバーとデスクロスオーバーシグナルが生成されます。

平均取引量(ATV)

ATVは特定の時点での取引された株式数であり、株式の流動性、投資家の参加、市場活動に関する情報を示します。SMAクロスオーバーから生成されたシグナルを確認または検証します。

相対強度指標(RSI)

RSIは、買われすぎおよび売られすぎの状態を見つけるために使用されるモメンタム識別子です。SMAクロスオーバーから生成された買いや売りのシグナルを確認します。

強化学習環境の設計

強化学習(RL)は、環境から学習して意思決定を行う動的な機械学習アプローチです。RLモデルは、SMAクロスオーバーシグナル、ATV、価格リターン、バイ、セル、ノートレードの行動空間を考慮に入れています

\情報配信中!/