预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

2024年3月15日现代电子技术Mar.2024ModernElectronicsTechnique第47卷第6期Vol.47No.6154DOI:10.16652/j.issn.1004‐373x.2024.06.025引用格式:杨旭,刘家鹏,越瀚,等.基于深度强化学习算法的投资组合策略与自动化交易研究[J].现代电子技术,2024,47(6):154‐160.基于深度强化学习算法的投资组合策略与自动化交易研究杨旭1,刘家鹏2,越瀚1,张芹1(1.中国计量大学经济与管理学院,浙江杭州310018;2.浙江万里学院商学院,浙江宁波315100)摘要:投资组合策略问题是金融领域经久不衰的一个课题,将人工智能技术用于金融市场是信息技术时代一个重要的研究方向。目前的研究较多集中在股票的价格预测上,对于投资组合及自动化交易这类决策性问题的研究较少。文中基于深度强化学习算法,利用深度学习的BiLSTM来预测股价的涨跌,以强化学习的智能体进行观测,更好地判断当期情况,从而确定自己的交易动作;同时,利用传统的投资组合策略来建立交易的预权重,使智能体可以在自动化交易的过程中进行对比,从而不断优化自己的策略选择,生成当期时间点内最优的投资组合策略。文章选取美股的10支股票进行实验,在真实的市场模拟下表明,基于深度强化学习算法的模型累计收益率达到了86.5%,与其他基准策略相比,收益最高,风险最小,具有一定的实用价值。关键词:投资组合策略;自动化交易;深度强化学习;BiLSTM;深度确定性策略梯度(DDPG);权重对比中图分类号:TN911‐34文献标识码:A文章编号:1004‐373X(2024)06‐0154‐07ResearchoninvestmentportfoliostrategyandautomatedtradingbasedondeepreinforcementlearningalgorithmYANGXu1,LIUJiapeng2,YUEHan1,ZHANGQin1(1.CollegeofEconomicsandManagement,ChinaJiliangUniversity,Hangzhou310018,China;2.CollegeofBusiness,ZhejiangWanliUniversity,Ningbo315100,China)Abstract:Theproblemofinvestmentportfoliostrategyisanenduringtopicinthefinancialfield,andtheapplicationofartificialintelligencetechniquesinfinancialmarketsisanimportantresearchdirectionintheinformationtechnologyera.Currentresearchismorefocusedonpricepredictionofstocks,andlessondecision‐makingproblemssuchasinvestmentportfolioandautomatedtrading.Basedonthedeepreinforcementlearningalgorithm,theBiLSTMofdeeplearningisusedtopredicttheriseandfallofstockprices,andthereinforcementlearningagentsisusedtoobserveandbetterassessthecurrentsituation,soastodetermineone′sowntradingactions.Intelligentagentscancomparisonduringautomatedtradingprocessesbyusingtraditionalinvestmentportfoliostrategytoestablishpreweightsfortransactions,soastocontinuouslyoptimizetheirstrategychoicesandgeneratetheoptimalinvestmentportfoliostrategyatthecurrenttimepoint.10stocksfromtheUSstockmarketareselectedforexperiments.Underrealmarketsimulations,theresultsshowthatthecumulativereturnofthemodelbasedonde