Tech 66

Anthropic's J-Space: A Global Workspace Inside Language Models Jul 20, 2026
The Bitter Lesson and Reward is Enough: Sutton's Two Principles of Intelligence Jul 19, 2026
From Noise to Data: An Introduction to Diffusion Models Jul 13, 2026
Policy-Conditioned Policies for Multi-Agent Task Solving Jul 10, 2026
Talk, Judge, Cooperate: Gossip-Driven Indirect Reciprocity in Self-Interested LLM Agents Jul 10, 2026
Verbalized Bayesian Persuasion Jul 10, 2026
Dynamic Programming Jun 20, 2026
A* Search Algorithm Jun 20, 2026
Computational Complexity: P, NP, PPAD and Game Theory Jun 20, 2026
Auctions and Mechanism Design Jun 20, 2026
MS-Swift GRPO Pipeline Walkthrough Jun 16, 2026
Mean-Field Game Jun 16, 2026
LLM x RL May 28, 2026
LLM Architecture Speedrun May 28, 2026
Minimal LLM Agent Oct 8, 2025
PSRO: Policy-Space Response Oracles Mar 8, 2025
Obsidian-Based Workspace Jan 17, 2025
Cheap Talk Dec 22, 2024
Llama Memo Jul 16, 2024
GPT Jun 10, 2024
Transformer Jun 5, 2024
Bargaining May 17, 2024
Extensive-Form Games and Subgame Perfect Equilibrium May 16, 2024
Mathematica Memos Apr 27, 2024
Building My Own PC Apr 26, 2024
TRPO Details Apr 24, 2024
Fairness Versus Reason in the Ultimatum Game Apr 22, 2024
Evolutionary Game Theory Apr 20, 2024
Code Visualization Apr 7, 2024
LyPythonToolbox Apr 5, 2024
Github Memo Apr 2, 2024
Python Project Template Mar 31, 2024
多智能体强化学习中的信息设计 Mar 15, 2024
Information Design in Multi-Agent Reinforcement Learning Mar 14, 2024
My Website Mar 10, 2024
MacOS Workspace Mar 2, 2024
PyTorch Toolbox Mar 1, 2024
Python Toolbox Dec 28, 2023
Stable Baseline 3 Dec 28, 2023
Overcooked: A MARL Task Dec 28, 2023
Tools of Visual Studio Code Dec 24, 2023
HyperNetworks Nov 13, 2023
Decision Transformers Nov 11, 2023
Contraction Mapping Theorem Oct 19, 2023
A Note on Stochastic Processes Sep 3, 2023
Zero-Determinant Strategy Aug 29, 2023
Classic Games Aug 13, 2023
Information Design in 10 Minutes Aug 10, 2023
A Memo on Game Theory Aug 10, 2023
Fictitious Self-Play and Zero-Shot Coordination Jul 31, 2023
Policy Gradient Details Jul 24, 2023
RNNs Jul 15, 2023
MARL Basics Jun 29, 2023
Computation Graph Visualization Jun 24, 2023
Dynamic Epistemic Logic Jun 22, 2023
Theory of Mind and Markov Models Jun 19, 2023
Information Design Jun 1, 2023
RL Toolbox Apr 10, 2023
Misc Code Toolbox Apr 9, 2023
Math Toolbox Apr 7, 2023
Swinging Search and Crawling Control Apr 3, 2023
RHex-T3: A Mobile Robot, with Hybrid Leg Design Apr 3, 2023
MARL Seminar | Simultaneously Learning and Advising in MARL Sep 6, 2022
MARL Seminar | MADDPG Jul 26, 2022
MARL Seminar | CommNet Mar 19, 2022
MARL Seminar | Public Sanctions Feb 15, 2022

Trending Tags

Tech Interdisciplinarity AI Life Multi_Agents RL Psychology Classic Game_Theory Efficiency Toolbox Economics Code_Utils Social_Dilemma Clinical Essays LLM Pastimes My_Work Theory