Reinforcement Learning 
======================

:doc:`Home </index>`

.. toctree::
   :maxdepth: 2
   
   log_derivative_trick
   trajectory_probability
   policy_gradient_proof
   policy_grad_alg