当前位置:   article > 正文

庙算兵棋推演AI开发初探(3-编写策略(下))_庙算兵棋推演随机数

庙算兵棋推演随机数

这回从解读step函数中的这两句代码开始,返回的action是真正做出的行为

  1. gen_action = self.priority[action_type]
  2. action = gen_action(obj_id, valid_actions[action_type])

追到self.priority 结果是一套定义

  1. self.priority = {
  2. ActionType.Occupy: self.gen_occupy,
  3. ActionType.Shoot: self.gen_shoot,
  4. ActionType.GuideShoot: self.gen_guide_shoot,
  5. ActionType.JMPlan: self.gen_jm_plan,
  6. ActionType.LayMine: self.gen_lay_mine,
  7. ActionType.ActivateRadar: self.gen_activate_radar,
  8. ActionType.ChangeAltitude: self.gen_change_altitude,
  9. ActionType.GetOn: self.gen_get_on,
  10. ActionType.GetOff: self.gen_get_off,
  11. ActionType.Fork: self.gen_fork,
  12. ActionType.Union: self.gen_union,
  13. ActionType.EnterFort: self.gen_enter_fort,
  14. ActionType.ExitFort: self.gen_exit_fort,
  15. ActionType.Move: self.gen_move,
  16. ActionType.RemoveKeep: self.gen_remove_keep,
  17. ActionType.ChangeState: self.gen_change_state,
  18. ActionType.StopMove: self.gen_stop_move,
  19. ActionType.WeaponLock: self.gen_WeaponLock,
  20. ActionType.WeaponUnFold: self.gen_WeaponUnFold,
  21. ActionType.CancelJMPlan: self.gen_cancel_JM_plan
  22. } # choose action by priority

仔细看一下,原来是类似于函数指针的写法,将一堆变量指向了一堆函数,然后在代码里定义了诸多的函数。

比如……gen_move函数,就是得到一个路径列表的返回值。

  1. def gen_move(self, obj_id, candidate):
  2. """Generate move action to a random city."""
  3. bop = self.get_bop(obj_id)
  4. if bop["sub_type"] == 3:
  5. return
  6. destination = random.choice(
  7. [city["coord"] for city in self.observation["cities"]]
  8. )
  9. if self.my_direction:
  10. destination = self.my_direction["info"]["target_pos"]
  11. if bop and bop["cur_hex"] != destination:
  12. move_type = self.get_move_type(bop)
  13. route = self.map.gen_move_route(bop["cur_hex"], destination, move_type)
  14. return {
  15. "actor": self.seat,
  16. "obj_id": obj_id,
  17. "type": ActionType.Move,
  18. "move_path": route,
  19. }
  1. 获取实体的当前位置(bop)。
  2. 如果实体的子类型为3,则直接返回一个空操作,因为该实体无法执行移动操作。
  3. 随机选择一个城市作为目的地。
  4. 如果机器人和目的地之间存在路径,则生成一个移动操作,其中actor表示执行该操作的实体(即self.seat),obj_id表示执行该操作的实体ID,type表示动作类型为ActionType.Movemove_path表示实体的移动路径。

这里map.gen_move_route函数和self.get_move_type函数又引用自其他地方编写的。

——

上一篇已经写了,调用起来就是遍历单位、找到合理的动作,再去使用编写的获取具体哪个动作的函数。

  1. # loop all bops and their valid actions
  2. for obj_id, valid_actions in observation["valid_actions"].items():
  3. if obj_id not in self.controllable_ops:
  4. continue
  5. for (
  6. action_type
  7. ) in self.priority: # 'dict' is order-preserving since Python 3.6
  8. if action_type not in valid_actions:
  9. continue
  10. # find the action generation method based on type
  11. gen_action = self.priority[action_type]
  12. action = gen_action(obj_id, valid_actions[action_type])
  13. if action:
  14. total_actions.append(action)
  15. break # one action per bop at a time
  16. # if total_actions:
  17. # print(
  18. # f'{self.color} actions at step: {observation["time"]["cur_step"]}', end='\n\t')
  19. # print(total_actions)
  20. return total_actions

就是上面这段,重点是本篇博文开始时提到的那两行。


基本流程至此都看明白了,那么如何编写一个策略呢?

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/422423
推荐阅读
相关标签
  

闽ICP备14008679号