Artificial Intelligence

Machine Learning Basics

| Minimal LLM Agent

| GPT

| Transformer

| HyperNetworks

| Decision Transformers

| RNNs

Multi-Agent Reinforcement Learning

| PSRO: Policy-Space Response Oracles

| 多智能体强化学习中的信息设计

| Information Design in Multi-Agent Reinforcement Learning

| Overcooked: A MARL Task

| Fictitious Self-Play and Zero-Shot Coordination

| MARL Basics

| Theory of Mind and Markov Models

| MARL Seminar | Simultaneously Learning and Advising in MARL

| MARL Seminar | MADDPG

| MARL Seminar | CommNet

| MARL Seminar | Public Sanctions

Reinforcement Learning

| TRPO Details

| Stable Baseline 3

| Policy Gradient Details

| RL Toolbox

| Llama Memo

| Code Visualization

| LyPythonToolbox

| Github Memo

| Python Project Template

| PyTorch Toolbox

| Python Toolbox

| Computation Graph Visualization

| Misc Code Toolbox

| Obsidian-Based Workspace

| Building My Own PC

| My Website

| MacOS Workspace

| Tools of Visual Studio Code

Interdisciplinarity

Economics & Game Theory

| Cheap Talk

| Bargaining

| Extensive-Form Games and Subgame Perfect Equilibrium

| Fairness Versus Reason in the Ultimatum Game

| Evolutionary Game Theory

| Zero-Determinant Strategy

| Classic Games

| Information Design in 10 Minutes

| A Memo on Game Theory

| Information Design

| Impulsivity

| Personality Traits

| Id, Ego, and Superego

| Five Stages of Grief

| Logotherapy

| Rational Emotive Behavior Therapy (REBT)

| Personality Miscs

| Swinging Search and Crawling Control

| RHex-T3: A Mobile Robot, with Hybrid Leg Design

| A* in 10 Minutes

| Mathematica Memos

| Contraction Mapping Theorem

| A Note on Stochastic Processes

| Dynamic Epistemic Logic

| Math Toolbox

| SDS Colloquium 12.26 - Richard Sutton

| PhD Program Academic Year 2024-2025 Term 1

| Perfume: The Story of a Murderer

| Poets Collection

| The "Meaning" of Life?

| Batman

| Patent of Information Design in Multi-Agent Reinforcement Learning

| For Prospective Undergraduates

| Certification of Rank

Home Categories Reinforcement Learning

Category

Reinforcement Learning 4

TRPO Details Apr 24, 2024
Stable Baseline 3 Dec 28, 2023
Policy Gradient Details Jul 24, 2023
RL Toolbox Apr 10, 2023

© 2026 Yue Lin. Some rights reserved.

LyTopia, adapted from the Chirpy theme

Trending Tags

Tech Multi_Agents AI Interdisciplinarity Classic RL Efficiency Game_Theory Life Toolbox Code_Utils Economics Social_Dilemma Psychology Literature Pastimes Information_Design Math ML Framework