Java/Scala 泛型快速入门教程
- 2020 年 2 月 26 日
- 筆記
泛型(Generics)是强类型编程语言中经常使用的一种技术。很多框架的代码中都会大量使用到泛型,比如在Java中我们经常看到的:
List<String> strList = new ArrayList<String>(); List<Double> doubleList = new LinkedList<Double>();
在这段代码中,ArrayList
就是一个泛型类,List
就是一个泛型接口类,他们提供给开发者一个放置不同类型的集合容器,我们可以向这个集合容器中添加String
、Double
以及其他各类数据类型。无论内部存储的是什么类型,集合容器提供给开发者的功能都是相同的,比如添加add
,get
等。有了泛型,我们就没必要创建StringArrayList
、DoubleArrayList
等集合了,否则代码量太大,维护起来成本极高。
在Java中,泛型一般有三种使用方式:泛型类,泛型方法和泛型接口类。一般使用尖括号<>
来接收泛型参数。
Java泛型类
假如我们自己定义一个支持泛型的MyArrayList
,这个列表类可以简单支持初始化和数据写入。只要在类名后面加上<T>
就可以让这个类支持泛型,类内部的一些属性和方法都可以使用泛型类型T
。当然我们给这个类也可以添加多个泛型参数,比如<K,V>
, <T,E,K>
等。在类中设置泛型会作用到整个类上。
public class MyArrayList<T> { private int size; T[] elements; public MyArrayList(int capacity) { this.size = capacity; this.elements = (T[]) new Object[capacity]; } public void set(T element, int position) { elements[position] = element; } @Override public String toString() { String result = ""; for (int i = 0; i < size; i++) { result += elements[i].toString(); } return result; } public static void main(String[] args){ MyArrayList<String> strList = new MyArrayList<String>(2); strList.set("first", 0); strList.set("second", 1); System.out.println(strList.toString()); } }
我们也可以从父类中继承并扩展泛型,比如Flink源码中有这样一个类定义,子类继承了父类的T
,同时自己增加了泛型KEY
:
public class KeyedStream<T, KEY> extends DataStream<T> { ... }
Java泛型接口类
Java泛型接口类的定义和Java泛型类基本相同。下面的代码展示了List
接口中定义subList
方法,该方法截取原来列表的一部分。
public interface List<E> { ... public List<E> subList(int fromIndex, int toIndex); }
继承并实现这个接口类的代码如下:
public class ArrayList<E> implements List<E> { ... public List<E> subList(int fromIndex, int toIndex) { subListRangeCheck(fromIndex, toIndex, size); return new SubList(this, 0, fromIndex, toIndex); } }
Java泛型方法
泛型方法可以存在于泛型类(包括接口类)中,也可以存在于普通的类中。
public class MyArrayList<T> { ... // public关键字和返回值E之间的<E>表明这是一个泛型方法 // 泛型方法中的类型E和泛型类中的类型T可以不一样 public <E> E processElement(E element) { ... return E; } }
从上面的代码示例可以看出,public
或private
关键字和方法返回值之间的尖括号<E>
表示这是一个泛型方法。泛型方法的类型E和泛型类中的T可以不一样,或者说,如果泛型方法是泛型类的一个成员,泛型方法既可以继续使用类中的T,也可以自己定义新的类型E。
通配符
除了用 <T>
表示泛型外,还有 <?>
这种形式。<?>
被称为通配符,用来适应各种不同的泛型。
泛型小结
对Java的泛型总结下来发现,虽然它的语法有时候让人有些眼花缭乱,其本质是为了接受不同的数据类型,增强代码的复用性。
我们可以在一个类里使用多个泛型,每个泛型一般使用大写字母表示。Java为此提供了一些大写字母使用规范:
- T 代表一般的任何类。
- E 代表元素(Element)或异常(Exception)。
- K 代表键(Key)。
- V 代表值(Value),通常与K一起配合使用,比如<K, V>。
Java的泛型给开发者提供了不少便利,尤其是保证了底层代码简洁性,因为这些底层代码通常被封装为一个框架,会有各种各样的上层应用调用这些底层代码进行特定的业务处理,每次调用都可能涉及泛型问题。比如,大数据框架Spark和Flink中都需要开发者基于泛型进行数据处理。
以上只对泛型做了一个简单的介绍,实际上在具体使用时还有一些细节需要注意。
类型擦除
Java的泛型有一个遗留问题,那就是类型擦除(Type Erasure)。我们先看一下下面的代码:
Class<?> strListClass = new ArrayList<String>().getClass(); Class<?> intListClass = new ArrayList<Integer>().getClass(); // 输出:class java.util.ArrayList System.out.println(strListClass); // 输出:class java.util.ArrayList System.out.println(intListClass); // 输出:true System.out.println(strListClass.equals(intListClass));
虽然声明时我们分别使用了String
和Integer
,但运行时关于泛型的信息被擦除了,我们无法区别strListClass
和intListClass
这两个类型。这是因为,泛型信息只存在于代码编译阶段,当程序运行到JVM上时,与泛型相关的信息会被擦除掉。类型擦除对于绝大多数应用系统开发者来说关系不太大,但是对于一些框架开发者来说,必须要注意。比如,Spark和Flink的开发者都使用了一些办法来解决类型擦除问题,对于API调用者来说,受到的影响不大。
Scala中的泛型
对Java的泛型有了基本了解后,我们接着来了解一下Scala中的泛型。相比而言,Scala的类型系统更复杂,本文只介绍一些简单语法,帮助读者能够读懂一些源码。
Scala中,泛型放在了中括号[]
中。或者我们可以简单地理解为,原来Java的泛型类<T>
,现在改为[T]
即可。
我们创建一个Stack[T]
的泛型类,并实现了两个简单的方法,类中各成员和方法都可以使用泛型T。我们也定义了泛型方法,形如isStackPeekEquals[T]
,方法中可以使用泛型T。
object MyStackDemo { // Stack泛型类 class Stack[T] { private var elements: List[T] = Nil def push(x: T) { elements = x :: elements } def peek: T = elements.head } // 泛型方法,检查两个Stack顶部是否相同 def isStackPeekEquals[T](p: Stack[T], q: Stack[T]): Boolean = { p.peek == q.peek } def main(args: Array[String]): Unit = { val stack = new Stack[Int] stack.push(1) stack.push(2) println(stack.peek) val stack2 = new Stack[Int] stack2.push(2) val stack3 = new Stack[Int] stack3.push(3) println(isStackPeekEquals(stack, stack2)) println(isStackPeekEquals(stack, stack3)) } }
总结
本文简单介绍了Java/Scala的泛型,它允许数据类型是可变,提升了代码的复用性,是很多框架都会采用的技术,开发者非常有必要了解泛型的基本用法。