pneuma-godot/addons/godot_rl_agents/controller/ai_controller_2d.gd

extends Node2D
class_name AIController2D

enum ControlModes { INHERIT_FROM_SYNC, HUMAN, TRAINING, ONNX_INFERENCE, RECORD_EXPERT_DEMOS }
@export var control_mode: ControlModes = ControlModes.INHERIT_FROM_SYNC
@export var onnx_model_path := ""
@export var reset_after := 1000

@export_group("Record expert demos mode options")
## Path where the demos will be saved. The file can later be used for imitation learning.
@export var expert_demo_save_path: String
## The action that erases the last recorded episode from the currently recorded data.
@export var remove_last_episode_key: InputEvent
## Action will be repeated for n frames. Will introduce control lag if larger than 1.
## Can be used to ensure that action_repeat on inference and training matches
## the recorded demonstrations.
@export var action_repeat: int = 1

@export_group("Multi-policy mode options")
## Allows you to set certain agents to use different policies.
## Changing has no effect with default SB3 training. Works with Rllib example.
## Tutorial: https://github.com/edbeeching/godot_rl_agents/blob/main/docs/TRAINING_MULTIPLE_POLICIES.md
@export var policy_name: String = "shared_policy"

var onnx_model: ONNXModel

var heuristic := "human"
var done := false
var reward := 0.0
var n_steps := 0
var needs_reset := false

var _player: Node2D


func _ready():
	add_to_group("AGENT")


func init(player: Node2D):
	_player = player


#-- Methods that need implementing using the "extend script" option in Godot --#
func get_obs() -> Dictionary:
	assert(false, "the get_obs method is not implemented when extending from ai_controller")
	return {"obs": []}


func get_reward() -> float:
	assert(false, "the get_reward method is not implemented when extending from ai_controller")
	return 0.0


func get_action_space() -> Dictionary:
	assert(
		false,
		"the get get_action_space method is not implemented when extending from ai_controller"
	)
	return {
		"example_actions_continous": {"size": 2, "action_type": "continuous"},
		"example_actions_discrete": {"size": 2, "action_type": "discrete"},
	}


func set_action(action) -> void:
	assert(false, "the set_action method is not implemented when extending from ai_controller")


#-----------------------------------------------------------------------------#


#-- Methods that sometimes need implementing using the "extend script" option in Godot --#
# Only needed if you are recording expert demos with this AIController
func get_action() -> Array:
	assert(false, "the get_action method is not implemented in extended AIController but demo_recorder is used")
	return []

# -----------------------------------------------------------------------------#

func _physics_process(delta):
	n_steps += 1
	if n_steps > reset_after:
		needs_reset = true


func get_obs_space():
	# may need overriding if the obs space is complex
	var obs = get_obs()
	return {
		"obs": {"size": [len(obs["obs"])], "space": "box"},
	}


func reset():
	n_steps = 0
	needs_reset = false


func reset_if_done():
	if done:
		reset()


func set_heuristic(h):
	# sets the heuristic from "human" or "model" nothing to change here
	heuristic = h


func get_done():
	return done


func set_done_false():
	done = false


func zero_reward():
	reward = 0.0
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00			`extends Node2D`
			`class_name AIController2D`

			`enum ControlModes { INHERIT_FROM_SYNC, HUMAN, TRAINING, ONNX_INFERENCE, RECORD_EXPERT_DEMOS }`
			`@export var control_mode: ControlModes = ControlModes.INHERIT_FROM_SYNC`
			`@export var onnx_model_path := ""`
			`@export var reset_after := 1000`

			`@export_group("Record expert demos mode options")`
			`## Path where the demos will be saved. The file can later be used for imitation learning.`
			`@export var expert_demo_save_path: String`
			`## The action that erases the last recorded episode from the currently recorded data.`
			`@export var remove_last_episode_key: InputEvent`
			`## Action will be repeated for n frames. Will introduce control lag if larger than 1.`
			`## Can be used to ensure that action_repeat on inference and training matches`
			`## the recorded demonstrations.`
			`@export var action_repeat: int = 1`

			`@export_group("Multi-policy mode options")`
			`## Allows you to set certain agents to use different policies.`
			`## Changing has no effect with default SB3 training. Works with Rllib example.`
			`## Tutorial: https://github.com/edbeeching/godot_rl_agents/blob/main/docs/TRAINING_MULTIPLE_POLICIES.md`
			`@export var policy_name: String = "shared_policy"`

			`var onnx_model: ONNXModel`

			`var heuristic := "human"`
			`var done := false`
			`var reward := 0.0`
			`var n_steps := 0`
			`var needs_reset := false`

			`var _player: Node2D`


			`func _ready():`
Update GODOT part 2024-06-13 16:44:02 +00:00			`add_to_group("AGENT")`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`func init(player: Node2D):`
Update GODOT part 2024-06-13 16:44:02 +00:00			`_player = player`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`#-- Methods that need implementing using the "extend script" option in Godot --#`
			`func get_obs() -> Dictionary:`
Update GODOT part 2024-06-13 16:44:02 +00:00			`assert(false, "the get_obs method is not implemented when extending from ai_controller")`
			`return {"obs": []}`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`func get_reward() -> float:`
Update GODOT part 2024-06-13 16:44:02 +00:00			`assert(false, "the get_reward method is not implemented when extending from ai_controller")`
			`return 0.0`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`func get_action_space() -> Dictionary:`
Update GODOT part 2024-06-13 16:44:02 +00:00			`assert(`
			`false,`
			`"the get get_action_space method is not implemented when extending from ai_controller"`
			`)`
			`return {`
			`"example_actions_continous": {"size": 2, "action_type": "continuous"},`
			`"example_actions_discrete": {"size": 2, "action_type": "discrete"},`
			`}`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`func set_action(action) -> void:`
Update GODOT part 2024-06-13 16:44:02 +00:00			`assert(false, "the set_action method is not implemented when extending from ai_controller")`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`#-----------------------------------------------------------------------------#`


			`#-- Methods that sometimes need implementing using the "extend script" option in Godot --#`
			`# Only needed if you are recording expert demos with this AIController`
			`func get_action() -> Array:`
Update GODOT part 2024-06-13 16:44:02 +00:00			`assert(false, "the get_action method is not implemented in extended AIController but demo_recorder is used")`
			`return []`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00
			`# -----------------------------------------------------------------------------#`

			`func _physics_process(delta):`
Update GODOT part 2024-06-13 16:44:02 +00:00			`n_steps += 1`
			`if n_steps > reset_after:`
			`needs_reset = true`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`func get_obs_space():`
Update GODOT part 2024-06-13 16:44:02 +00:00			`# may need overriding if the obs space is complex`
			`var obs = get_obs()`
			`return {`
			`"obs": {"size": [len(obs["obs"])], "space": "box"},`
			`}`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`func reset():`
Update GODOT part 2024-06-13 16:44:02 +00:00			`n_steps = 0`
			`needs_reset = false`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`func reset_if_done():`
Update GODOT part 2024-06-13 16:44:02 +00:00			`if done:`
			`reset()`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`func set_heuristic(h):`
Update GODOT part 2024-06-13 16:44:02 +00:00			`# sets the heuristic from "human" or "model" nothing to change here`
			`heuristic = h`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`func get_done():`
Update GODOT part 2024-06-13 16:44:02 +00:00			`return done`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`func set_done_false():`
Update GODOT part 2024-06-13 16:44:02 +00:00			`done = false`
Moved Godot version to own repo for clarity 2024-05-22 06:45:43 +00:00

			`func zero_reward():`
Update GODOT part 2024-06-13 16:44:02 +00:00			`reward = 0.0`