General Reinforcement Learning Algorithm: AlphaZero & AlphaGo

General Reinforcement Learning Algorithm: AlphaZero & AlphaGo 3

Description / TOC

AlphaGo. General Reinforcement Learning Algorithm. AlphaZero vs AlphaGo Zero. AlphaZero has hard-coded rules for setting search hyperparameters. AlphaZero was trained solely via self-play. AlphaZero vs Stockfish. AlphaZero vs Stockfish results 28/0/72(W/L/D) 12 most popular human openings.

Category: Technology Presentations
File: MS PowerPoint 1508 KB
Uploaded: 2018 m.
Language: English
Page count: 16 pages (126 words)
Level: University
Author: Jonas
Rating:

General Reinforcement Learning Algorithm: AlphaZero & AlphaGo

10 - 3 votes

Download document

Explore by interests

Learn by example

Explore by document type

General Reinforcement Learning Algorithm: AlphaZero & AlphaGo