Winy Song issues

Results 21 issues of


Winy Song

Inconsistent between code and pseudocode in agent input

Reading the pseudocode in paper [Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning](https://arxiv.org/abs/2003.08839) ![image](https://user-images.githubusercontent.com/40143136/127792343-ddbc8948-5e14-4faa-8b0d-0b00efbcc401.png) The inputs of agent network is τᵃₜ and uᵃₜ. According to the pseudocode, τ is...

CSDN 拦截错误

CSDN 在此套拦截规则下加载不了评论

Example 20 failed with ValueError: cannot convert float NaN to integer

- Progressbar version: 2.5 - OS: OS: Arch Linux x86_64 - Kernel: 5.18.3-arch1-1 ``` > python examples.py Running: Example 20 Traceback (most recent call last): File "~/sourcecode/examples.py", line 240, in...

RSS support for Quora

### Website URL ### What content should be included? RSS support for - [ ] user profile pages - [ ] user question pages - [ ] user answer pages...

RSS proposal

[Request] Add support for vim keyboard-based navigation

I use [Vimium](https://github.com/philc/vimium), a browser extension that provides keyboard-based navigation, in my browser. However, when the current page is opened in the "Reader View" mode, Vimium is disabled at the...

双亲委派模型的工作过程

*双亲委派模型* 这一小节中 `图7-2 类加载器双亲委派模型` 是像下图这样的 ![image](https://user-images.githubusercontent.com/40143136/192088658-2a35592d-facf-4efb-8784-f811578d1561.png) 下面是让我糊涂的几段文字 > 图7-2中展示的各种类加载器之间的层次关系被称为类加载器的“双亲委派模型(Parents Delegation Model)”。双亲委派模型要求除了顶层的启动类加载器外,其余的类加载器都应有自己的父类加载器。不过这里类加载器之间的父子关系一般不是以继承(Inheritance)的关系来实现的,而是通常使用组合(Composition)关系来复用父加载器的代码。 > ... > 双亲委派模型的工作过程是:如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到最顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去完成加载。 > ... > 这段代码的逻辑清晰易懂:先检查请求加载的类型是否已经被加载过,若没有则调用父加载器的loadClass()方法,若父加载器为空则默认使用启动类加载器作为父加载器。假如父类加载器加载失败,抛出ClassNotFoundException异常的话,才调用自己的findClass()方法尝试进行加载。问题一：这一小节没有定义“类加载器之间的父子关系”是什么，我猜测 `图7-2 类加载器双亲委派模型` 里面想表示的是这种关系，箭头指向的是父加载器。但是文章中只说了“图7-2中展示的各种类加载器之间的层次关系”，这种“层次关系”是“父子层次关系”么？问题二： “代码逻辑”里面有“若没有则调用父加载器的loadClass()方法,若父加载器为空则默认使用启动类加载器作为父加载器”这样一段话。 “双亲委派模型的工作过程”里却没有提到“父加载器”为空的情况，只提到“父加载器反馈自己无法完成这个加载请求”这种情况。问题三： > 假如父类加载器加载失败,抛出ClassNotFoundException异常的话,才调用自己的findClass()方法尝试进行加载。...

如何使用贝尔曼期望方程计算价值函数 V (s)？

在[中文版](https://deepreinforcementlearningbook.org/assets/pdfs/%E6%B7%B1%E5%BA%A6%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0(%E4%B8%AD%E6%96%87%E7%89%88-%E5%BD%A9%E8%89%B2%E5%8E%8B%E7%BC%A9).pdf)的 `2.3.2 马尔可夫奖励过程` 中介绍了 `价值函数（Value Function）V (s)`，书中是这么说的： > 价值函数（Value Function）V(s) 是状态 s 的期望回报（Expected Return）。 > > 一种估计价值 V (s) 的简单方法是蒙特卡罗法，给定一个状态 s，我们用状态转移矩阵 P 随机采样大量的轨迹，来求近似期望。 > > 除了蒙特卡罗方法，还有很多方法可以用来计算 V (s)，比如贝尔曼期望方程（Bellman Expectation Equation）、逆矩阵方法（Inverse...

Winy Song