Java 热更新 Groovy 实践及踩坑指南

2022 年 9 月 13 日
笔记
Deploy, Groovy, JAVA, 性能, 源码, 热更新, 热部署, 脚本

Groovy 是什么？

Apache的Groovy是Java平台上设计的面向对象编程语言。这门动态语言拥有类似Python、Ruby和Smalltalk中的一些特性，可以作为Java平台的脚本语言使用，Groovy代码动态地编译成运行于Java虚拟机（JVM）上的Java字节码，并与其他Java代码和库进行互操作。

由于其运行在JVM上的特性，Groovy可以使用其他Java语言编写的库。Groovy的语法与Java非常相似，大多数Java代码也符合Groovy的语法规则，尽管可能语义不同。 Groovy 1.0于2007年1月2日发布，并于2012年7月发布了Groovy 2.0。从版本2开始，Groovy也可以静态编译，提供类型推论和Java相近的性能。Groovy 2.4是Pivotal软件赞助的最后一个主要版本，截止于2015年3月。Groovy已经将其治理结构更改为Apache软件基金会的项目管理委员会（PMC）[1]。

Java 为何需要 Groovy ?

Groovy 特性如下：

语法上支持动态类型，闭包等新一代语言特性
无缝集成所有已经存在的Java类库
既支持面向对象编程也支持面向过程编程
执行方式可以将groovy编写的源文件编译成class字节码文件，然后交给JVM去执行，也可以直接将groovy源文件解释执行。
Groovy可以与Java完美结合，而且可以使用java所有的库

Groovy 优势如下：

敏捷
- groovy 在语法上加入了很多语法糖，很多 Java 严格的书写语法，在 Groovy 中只需要少量的语法糖即可实现
Groovy 的灵活性是的它既可以作为变成语言，亦可作为脚本语言
0成本学习 Groovy，完美适配 Java 语法

热部署技术设计及实现

使用场景

我将介绍如下几种常用的适合 Groovy 脚本热更新的场景，供您学习

风控安全——规则引擎

风控的规则引擎非常适合用 groovy 来实现，对抗黑产，策略人员每天都都会产出拦截规则，如果每次都需要发版，可能发完观测完后，该薅的羊毛都被黑产薅没了。

所以利用 groovy 脚本引擎的动态解析执行，使用规则脚本将查拦截规则抽象出来，快速部署，提升效率。

监控中心

大型互联网系统，伴随着海量数据进入，各个层级的人员需要时时刻刻关注业务的各个维度指标，此时某个指标异常光靠人肉是没办法实现的。此时需要监控中心介入，提前部署好异动规则，当异常发生时，监控中心发出告警通知到对应的规则创建人员，从而尽快查明原因，挽回资损。

此时要保证监控中心异常灵活，可以随时随地满足业务人员或者研发人员配置监控指标，测试我们可以使用 Groovy 条件表达式，满足灵活监控规则配置需求。

活动营销

营销活动配置是我个人觉得最复杂的业务之一。活动模板多样，千人千面，不同人群看到的活动样式或者“奖品”不一。且活动上线要快，效果回收，投入产出比等要能立即观测。

此时需要工程侧抽象出整个活动模板，在需要变化的地方嵌入 Groovy 脚本，这样就减少了测试和发版的时间，做到活动可线上配置化。

技术实现

脚本加载/更新

代码实现展示：

/**
 * 加载脚本
 * @param script
 * @return
 */
public static GroovyObject buildScript(String script) {
    if (StringUtils.isEmpty(script)) {
        throw new RuntimeException("script is empty");
    }

    String cacheKey = DigestUtils.md5DigestAsHex(script.getBytes());
    if (groovyObjectCache.containsKey(cacheKey)) {
        log.debug("groovyObjectCache hit");
        return groovyObjectCache.get(cacheKey);
    }

    GroovyClassLoader classLoader = new GroovyClassLoader();
    try {
        Class<?> groovyClass = classLoader.parseClass(script);
        GroovyObject groovyObject = (GroovyObject) groovyClass.newInstance();
        classLoader.clearCache();

        groovyObjectCache.put(cacheKey, groovyObject);
        log.info("groovy buildScript success: {}", groovyObject);
        return groovyObject;
    } catch (Exception e) {
        throw new RuntimeException("buildScript error", e);
    } finally {
        try {
            classLoader.close();
        } catch (IOException e) {
            log.error("close GroovyClassLoader error", e);
        }
    }
}

重点关注：

脚本开启缓存处理：否则多次会更新可能会导致 Metaspace OutOfMemery

脚本执行

// 程序内部需要关联出待执行的脚本即可
try {
    Map<String, Object> singleMap = GroovyUtils.invokeMethod2Map(s.getScriptObject(), s.getInvokeMethod(), params);
    data.putAll(singleMap);
} catch (Throwable e) {
    log.error(String.format("RcpEventMsgCleanScriptGroovyHandle groovy error, guid: %d eventCode: %s",
            s.getGuid(), s.getEventCode()), e);
}

// 三种执行方式，看 脚本内部返回的结果是什么
public static Map<String, Object> invokeMethod2Map(GroovyObject scriptObject, String invokeMethod, Object[] params) {
    return (Map<String, Object>) scriptObject.invokeMethod(invokeMethod, params);
}

public static boolean invokeMethod2Boolean(GroovyObject scriptObject, String invokeMethod, Object[] params) {
    return (Boolean) scriptObject.invokeMethod(invokeMethod, params);
}

public static String invokeMethod2String(GroovyObject scriptObject, String invokeMethod, Object[] params) {
    log.debug("GroovyObject class: {}", scriptObject.getClass().getSimpleName());
    return (String) scriptObject.invokeMethod(invokeMethod, params);
}

生产踩坑指南

Java8 lambda 与 Groovy 语法问题

都说 Groovy 能完美兼容 Java 语法，即直接复制 Java 代码到 Groovy 文件内，亦能编译成功。
事实真的如此么，我们看如下执行的代码：

Set<String> demo = new HashSet<>();
demo.add("111");
demo.add("222");

for (String s : demo) {
    executor.submit({ -> 
        println "submit: " + s;                 
    });
}

for (String s in demo) {
    executor.submit({ -> 
        println "sp submit: " + s;                 
    });
}


// 输出结果
// submit: 222
// sp submit: 222
// submit: 222
// sp submit: 222

此时代码并没有按照预期的结果输出 111， 222，这是为什么呢？

答：lambda 语法在 Groovy 中语义和在Java 中不一致，虽然编译不出错，但表达的语义不一致
在 Groovy 中表示闭包概念，此处不熟悉的可以 Google 详细了解 Groovy 语法。

GroovyClassLoader 加载机制导致频繁gc问题

通常加载 Groovy 类代码如下：

GroovyClassLoader groovyLoader = new GroovyClassLoader();
Class<Script> groovyClass = (Class<Script>) groovyLoader.parseClass(groovyScript);
Script groovyScript = groovyClass.newInstance();

每次执行 groovyLoader.parseClass(groovyScript)，Groovy 为了保证每次执行的都是新的脚本内容，会每次生成一个新名字的Class文件，这个点已经在前文中说明过。当对同一段脚本每次都执行这个方法时，会导致的现象就是装载的Class会越来越多，从而导致PermGen被用满。

同时这里也存在性能瓶颈问题，如果去分析这段代码会发现90%的耗时占用在Class。

如上实战过程中，已经给出了解决办法：

对于 parseClass 后生成的 Class 对象进行cache，key 为 groovyScript 脚本的md5值

脚本首次执行耗时高

在初期方案上线时，压测后显示，首次加载脚本性能较慢，后续脚本执行速度非常快，猜测可能是 Groovy 内部在首次脚在脚本时还做了其他的校验（本人还没跟进这块，如果有读者感兴趣，可以断点详细看下链路耗时在哪里）

正对首次加载缓慢问题，解决方法如下：

// 1.加载脚本，并缓存
GroovyObject object = loadClass(classSeq);
cacheMap.put(md5(classSeq), object);

// 2.预热
// 模拟方法调用
cacheMap.get(md5(classSeq)).invoke();

// 3.开放给线上流量使用

往期精彩

个人技术博客：//jifuwei.github.io/
公众号：是咕咕鸡

参考：
[1] Groovy Wiki

Tags: Deploy Groovy JAVA 性能源码热更新热部署脚本