pneuma-pygame/main.py

import numpy as np
import matplotlib.pyplot as plt

from game import Game
from tqdm import tqdm

from os import environ
environ['PYGAME_HIDE_SUPPORT_PROMPT'] = '1'


if __name__ == '__main__':

    n_episodes = 1000
    game_len = 10000

    figure_file = 'plots/score.png'
    best_score = 0
    avg_score = 0

    game = Game()

    agent_list = []
    exp_points_list = []
    score_history = np.zeros(
        shape=(len(game.level.player_sprites), n_episodes, ))
    best_score = np.zeros(len(game.level.player_sprites))
    avg_score = np.zeros(len(game.level.player_sprites))
    for i in tqdm(range(n_episodes)):
        # TODO: Make game.level.reset_map() so we don't __init__ everything all the time (such a waste)
        if i != 0:
            game.level.__init__(reset=True)
        # TODO: Make game.level.reset_map() so we don't pull out and load the agent every time (There is -definitevly- a better way)
            for player in game.level.player_sprites:
                for agent in agent_list:
                    player.agent = agent_list[player.player_id]
                    player.stats.exp = score_history[player.player_id][i-1]

        agent_list = []

        for j in range(game_len):
            if not game.level.done:

                game.run()
                game.calc_score()

                if (j == game_len-1 or game.level.done) and game.level.enemy_sprites != []:
                    for player in game.level.player_sprites:
                        for enemy in game.level.enemy_sprites:
                            player.stats.exp *= .95
            else:
                break

        for player in game.level.player_sprites:
            agent_list.append(player.agent)
            exp_points = player.stats.exp
            score_history[player.player_id][i] = exp_points
            avg_score[player.player_id] = np.mean(
                score_history[player.player_id])
            if avg_score[player.player_id] >= best_score[player.player_id]:
                player.agent.save_models()
                best_score[player.player_id] = avg_score[player.player_id]

            print(
                f"\nCumulative score for player {player.player_id}:\
                    {score_history[0][i]}\
                    \nAverage score for player {player.player_id}:\
                    {avg_score[player.player_id]}\
                    \nBest score for player {player.player_id}:\
                    {best_score[player.player_id]}")

    plt.plot(score_history[0])

    game.quit()

    plt.show()
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00			`import numpy as np`
			`import matplotlib.pyplot as plt`

Added more rewards 2023-11-19 03:27:47 +00:00			`from game import Game`
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00			`from tqdm import tqdm`
Reenabled Player and all animations, upgrades, attacks and spells 2023-09-27 18:03:37 +00:00
Added more rewards 2023-11-19 03:27:47 +00:00			`from os import environ`
			`environ['PYGAME_HIDE_SUPPORT_PROMPT'] = '1'`
Reenabled Player and all animations, upgrades, attacks and spells 2023-09-27 18:03:37 +00:00

			`if __name__ == '__main__':`
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00
			`n_episodes = 1000`
			`game_len = 10000`
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00
			`figure_file = 'plots/score.png'`
			`best_score = 0`
			`avg_score = 0`

Reenabled Player and all animations, upgrades, attacks and spells 2023-09-27 18:03:37 +00:00			`game = Game()`
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00			`agent_list = []`
			`exp_points_list = []`
			`score_history = np.zeros(`
			`shape=(len(game.level.player_sprites), n_episodes, ))`
			`best_score = np.zeros(len(game.level.player_sprites))`
			`avg_score = np.zeros(len(game.level.player_sprites))`
Added more rewards 2023-11-19 03:27:47 +00:00			`for i in tqdm(range(n_episodes)):`
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00			`# TODO: Make game.level.reset_map() so we don't __init__ everything all the time (such a waste)`
Added more rewards 2023-11-19 03:27:47 +00:00			`if i != 0:`
			`game.level.__init__(reset=True)`
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00			`# TODO: Make game.level.reset_map() so we don't pull out and load the agent every time (There is -definitevly- a better way)`
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00			`for player in game.level.player_sprites:`
			`for agent in agent_list:`
			`player.agent = agent_list[player.player_id]`
			`player.stats.exp = score_history[player.player_id][i-1]`
Added more rewards 2023-11-19 03:27:47 +00:00
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00			`agent_list = []`
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00
			`for j in range(game_len):`
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00			`if not game.level.done:`
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00			`game.run()`
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00			`game.calc_score()`

			`if (j == game_len-1 or game.level.done) and game.level.enemy_sprites != []:`
			`for player in game.level.player_sprites:`
			`for enemy in game.level.enemy_sprites:`
			`player.stats.exp *= .95`
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00			`else:`
			`break`
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00			`for player in game.level.player_sprites:`
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00			`agent_list.append(player.agent)`
			`exp_points = player.stats.exp`
			`score_history[player.player_id][i] = exp_points`
			`avg_score[player.player_id] = np.mean(`
			`score_history[player.player_id])`
			`if avg_score[player.player_id] >= best_score[player.player_id]:`
			`player.agent.save_models()`
			`best_score[player.player_id] = avg_score[player.player_id]`
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00			`print(`
			`f"\nCumulative score for player {player.player_id}:\`
			`{score_history[0][i]}\`
			`\nAverage score for player {player.player_id}:\`
			`{avg_score[player.player_id]}\`
			`\nBest score for player {player.player_id}:\`
			`{best_score[player.player_id]}")`
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00			`plt.plot(score_history[0])`
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00			`game.quit()`
Hopefully implemented PPO 2023-11-17 02:19:03 +00:00
Update rewared structure (fixed major bugs) 2023-11-23 11:44:23 +00:00			`plt.show()`