基于均值偏差奖赏函数的放煤口控制策略研究
罗开成, 高阳, 杨艺, 常亚军, 袁瑞甫
Intelligent decision-making of top coal caving based on mean deviation reward function
煤炭工程 . 2022, (9): 105 -111 .  DOI: 10.11799/ce202209019