Tech 53

Minimal LLM Agent Oct 8, 2025
PSRO: Policy-Space Response Oracles Mar 8, 2025
A* in 10 Minutes Mar 6, 2025
Obsidian-Based Workspace Jan 17, 2025
Cheap Talk Dec 22, 2024
Llama Memo Jul 16, 2024
GPT Jun 10, 2024
Transformer Jun 5, 2024
Bargaining May 17, 2024
Extensive-Form Games and Subgame Perfect Equilibrium May 16, 2024
Mathematica Memos Apr 27, 2024
Building My Own PC Apr 26, 2024
TRPO Details Apr 24, 2024
Fairness Versus Reason in the Ultimatum Game Apr 22, 2024
Evolutionary Game Theory Apr 20, 2024
Code Visualization Apr 7, 2024
LyPythonToolbox Apr 5, 2024
Github Memo Apr 2, 2024
Python Project Template Mar 31, 2024
多智能体强化学习中的信息设计 Mar 15, 2024
Information Design in Multi-Agent Reinforcement Learning Mar 14, 2024
My Website Mar 10, 2024
MacOS Workspace Mar 2, 2024
PyTorch Toolbox Mar 1, 2024
Python Toolbox Dec 28, 2023
Stable Baseline 3 Dec 28, 2023
Overcooked: A MARL Task Dec 28, 2023
Tools of Visual Studio Code Dec 24, 2023
HyperNetworks Nov 13, 2023
Decision Transformers Nov 11, 2023
Contraction Mapping Theorem Oct 19, 2023
A Note on Stochastic Processes Sep 3, 2023
Zero-Determinant Strategy Aug 29, 2023
Classic Games Aug 13, 2023
Information Design in 10 Minutes Aug 10, 2023
A Memo on Game Theory Aug 10, 2023
Fictitious Self-Play and Zero-Shot Coordination Jul 31, 2023
Policy Gradient Details Jul 24, 2023
RNNs Jul 15, 2023
MARL Basics Jun 29, 2023
Computation Graph Visualization Jun 24, 2023
Dynamic Epistemic Logic Jun 22, 2023
Theory of Mind and Markov Models Jun 19, 2023
Information Design Jun 1, 2023
RL Toolbox Apr 10, 2023
Misc Code Toolbox Apr 9, 2023
Math Toolbox Apr 7, 2023
Swinging Search and Crawling Control Apr 3, 2023
RHex-T3: A Mobile Robot, with Hybrid Leg Design Apr 3, 2023
MARL Seminar | Simultaneously Learning and Advising in MARL Sep 6, 2022
MARL Seminar | MADDPG Jul 26, 2022
MARL Seminar | CommNet Mar 19, 2022
MARL Seminar | Public Sanctions Feb 15, 2022