728x90
1. Abstract
1.1 현황
- 강화 학습 방법들이 만들어지면서 알고리즘 트레이딩을 포함한 다양한 방면들에서 활용되고 있다.
1.2 소개
- 본 논문에서 주식 거래는 상태, 동작, 리워드로 마르코브 성질을 가지고 있는 것들을 이용한 게임으로 보고
- 금융 상품을 거래하는 시스템을 소개하고, 실험하였다.
- 이 시스템은 다양한 비동기 actor와 critic 신경망 아키텍처를 기반으로한다.
1.3 실험
- 실제로 데이터를 익명화하여 실험을 수행함.
- 가장 좋은 주식 거래를 한 아키텍처의 경우 RTS 선물 시세엣 연간 66%의 수익을 얻을수가 있었습니다.
300x250