画像の連結(OpenCV)

Python tips

メモ。このファイルのディレクトリの子ディレクトリにimgの中に、arrow_0.png～arrow_7.pngを入れておく。変数はQ Learningの時使ったやつなので、このままでは動かない。 # 画像を読み込んで concatenate することで，くっつけてる。 import cv2 import num…

2019-10-02

Open AI Spinning Up で深層強化学習のお勉強 -Part 2: Kinds of RL Algorithms-

OpenAI Spinning Up deep RL

INTRODUCTION TO RL -Part 2: Kinds of RL Algorithms- 前回の続きです。前回の記事はこちら。 coffee-g9.hatenablog.com OpenAI Spinning Upのページはこちら。 spinningup.openai.com INTRODUCTION TO RL -Part 2: Kinds of RL Algorithms- はじめに A Ta…

2019-09-29

Open AI Spinning Up で深層強化学習のお勉強 -Part 1: Key Concepts in RL- [その2]

OpenAI Spinning Up deep RL

INTRODUCTION TO RL -Part 1: Key Concepts in RL- 前回の続き。後半（Key Concepts and TerminologyのValue Functionsから）です。前回の記事はこちら。 coffee-g9.hatenablog.com OpenAI Spinning Upのページはこちら。 spinningup.openai.com INTRODUCTI…

2019-09-28

Open AI Spinning Up で深層強化学習のお勉強 -Part 1: Key Concepts in RL- [その1]

OpenAI Spinning Up deep RL

INTRODUCTION TO RL -Part 1: Key Concepts in RL- 今回のページです。長いので分けます。今回は前半（Key Concepts and TerminologyのThe RL Problemまで）だけ。 spinningup.openai.com INTRODUCTION TO RL -Part 1: Key Concepts in RL- はじめに What Ca…

2019-09-27

Open AI Spinning Up で深層強化学習のお勉強 -Algorithms-

OpenAI Spinning Up deep RL

Algorithms 今回のページとソースコードです。ざっくりとまとめていきます。 spinningup.openai.com github.com Algorithms What's Included Why These Algorithm? The On-Policy Algorithms The Off-Policy Algorithms Code Format The Algorithm File The …

2019-09-26

Polyak Averaging

Deep Learning Machine Learning

Polyak Averaging Polyak-Ruppert Averaging Polyak Averaging Polyak Averagingは、最適化アルゴリズム中のパラメーター空間内のいくつかのポイントの平均化です。そのため、最適化中にポイントが得られた場合、Polyak Averagingは次のようになります。以…

2019-09-22