Naive版本是指收集最近K个迭代信息,然后用于计算当前迭代时刻的统计量,可以发现由于梯度更新原因,直接计算统计量其实没有效果,而本文的CBN可以比较好的克服。


- 相关评论
- 我要评论
-
300
300
299
299
299
299
299
299
299
298
298
298
298
298
298
297
297
297
297
296
296
296
296
296
296
296
295
295
295
295
295
294
294
293
293
293
292
292
292
292
292
291
291
290
290