MyBlog

一只逆风微笑的代码狗,记录生活趣闻和代码笔记

强化学习Sarsa和Sarsa Lambda

on-policy强化学习Sarsa和Sarsa Lambda

Sarsa ”SARSA“ 五个字母是当前 S (状态), A(行动), R(奖励) 与 下一步S’(状态) A’(行动) 的组合,即我们不仅需要知道当前的S, A, R 还需要知道下一步的 S’ 和 A‘。 在Sarsa算法中,智能体的目标是R(S1) + γ*Q(S1,A) 至于A是多少,完全取决于智能体实际上选择的哪一个Action。智能体有90%的概率会选择Q值最大的Actio...

JVM堆内存结构&GC回收机制&参数设置

JVM堆内存空间的结构& Minor GC & Major GC & Full GC的垃圾回收机制

堆(Heap) 堆的概述 堆的内存结构 堆空间大小的设置 年轻代&老年代 对象分配的一般过程 Minor GC & Major GC & Full GC Minor GC触发机制 ...

JVM程序计数器&虚拟机栈&本地方法栈

JVM的学习笔记之运行时数据区的部分内容

运行时数据区 程序计数器(PC寄存器) 使用PC寄存器存储字节码指令地址的作用? PC寄存器为什么会被设定为线程私有? 虚拟机栈 Java虚拟机栈 特点 ...

JVM概述&类加载器子系统

JVM的整体架构,发展历程,类加载器子系统,双亲委派机制

JVM概述 JVM特点 JVM的整体结构 JVM的架构模型 基于栈式架构 基于寄存器架构 发展历程 Sun Classic VM Sun Hotspot VM 类加载器子系统(Class Loader) 作用 类加载过程 ...

IO流

流的分类以及使用

IO流 File类 理解 File的实例化 IO流 流的分类 重要的流结构 输入、输出的标准化过程 缓冲流 转换流 对象流 ...

Java集合

List接口,Map接口,Collections工具类

集合 集合与数组 集合的分类 Collection接口 1. 迭代器接口:Iterator 2. foreach(内部仍然调用了迭代器) Collection子接口:...

Java常用类&比较器

String类,Date类,Comparable接口,Comparator接口

常用类 枚举类 Date类 基本概念 相关的API BigInteger类&BigDecimal类 String类 说明 String & StringBuffer ...

Java多线程

创建线程的4种方式,通信安全

基本概念 程序(program) 进程(process) 线程(thread) 多线程(multi-thread) 优点 应用场合 生成线程 Java同步机制来解决线程安全的问题 ...

异常处理

Java异常处理的两种方式

异常处理 Error Exception 抓抛模型 try-catch-finally throw&throws 异常处理 Error 定义:JVM无法解决的严重问题 如:JVM系统内部错误,资源耗尽 栈溢出:java.lang.StackOverFlowError 堆溢...

Java面向对象

封装、继承、多态

面向对象 基本概念 面向对象&面向过程 类&对象 形参&实参 方法的重载(overload)& 方法的重写(override) 方法的重载 方法的重写 ...