Java8的λ表达式与stream API

JDK1.8新增的λ表达式与stream API是颗很甜的语法糖，能够让某些场景下的代码变得更简洁。结合函数式编程、行为参数化的思想与模板方法模式来学习能有更深的理解。

# JDK1.5~1.8发展简要回顾

# JDK5

JDK 5中主要新增了自动装箱与拆箱、枚举、静态导入、变长参数、泛型、JUC并发包和增强for（for-each循环）等特性。

静态导入：

import static java.lang.System.out;

public class StaticImport {
    public static void main(String[] args) {
        out.println("Hi let's learn java 8.");
    }
}

1
2
3
4
5
6
7

变长参数：

public void execute(Vehicle ... cars){
    for(Vehicle v:cars){
        v.run();
    }
}

1
2
3
4
5

# JDK6

JDK6并没有增加太多常用的特性，主要包含CompilerAPI、Console、DesktopTray、HttpServerAPI、ScriptEngine。

# JDK7

JDK7新增了多异常捕获、数字下划线支持、支持对String和枚举使用switch、tryWithResource、编译器类型推断。

多异常捕获：

public static void main(String[] args) {
    try {
        BufferedReader reader = new BufferedReader(new FileReader(""));
        Connection     con    = null;
        Statement      stmt   = con.createStatement();
    } catch (IOException | SQLException e) {
        //捕获多个异常，e就是final类型的
        e.printStackTrace();
    }
}

1
2
3
4
5
6
7
8
9
10

数字下划线支持（看起来更清晰）:

public static void main(String[] args) {
    int   num         = 1234_5678_9;
    float num2        = 222_33F;
    long  num3        = 123_000_111L;
    long  tenSenconds = 10_000L;
}

1
2
3
4
5
6

TryWithResource（自动关闭资源）：

public static void main(String[] args) {
    String path = ScriptEngineDemo.class.getResource("/test.js").getPath();

    try (BufferedReader br = new BufferedReader(new FileReader(path))) {
        String str = br.readLine();
        while (null != str) {
            System.out.println(str);
            str = br.readLine();
        }
    } catch (IOException e) {
        e.printStackTrace();
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13

# JDK8

JDK8中，新增了内置Base64字符编码、更为精准的日期时间API(java.time.*)、接口中允许有静态方法的实现、nashorn脚本引擎、函数式接口+lambda表达式、stream流和Arrays工具中并行处理等特性。

Base64编码：

public static void main(String[] args) {
    final String text = "Lets Learn Java 8!";

    final String encoded = Base64
            .getEncoder()
            .encodeToString(text.getBytes(StandardCharsets.UTF_8));
    System.out.println(encoded);

    final String decoded = new String(
            Base64.getDecoder().decode(encoded),
            StandardCharsets.UTF_8);
    System.out.println(decoded);
}

1
2
3
4
5
6
7
8
9
10
11
12
13

nashorn脚本引擎:

public static void main(String[] args) throws ScriptException {
    ScriptEngineManager manager = new ScriptEngineManager();
    ScriptEngine        engine  = manager.getEngineByName("JavaScript");

    System.out.println(engine.getClass().getName());
    System.out.println("Result:" + engine.eval("function f() { return 1; }; f() + 1;"));
}

1
2
3
4
5
6
7

函数式接口：

@FunctionalInterface
public interface Functional {
    void method();
    //optional
    default void defaultMethod() {
    }
}

1
2
3
4
5
6
7

# 初识lambda

lambda表达式由参数+->+body组成，鼓励开发者使用行为参数化的风格（方法回调，策略模式），让代码变得更加清晰和灵活，具有以下特性：

匿名：它不像普通的方法那样有一个明确的名称：写得少而想得多！
函数：lambda函数不像方法那样属于某个特定的类。但和方法一样，有参数列表、函数主体、返回类型，述可能有可以抛出的异常列表。
传递：lambda表达式可以作为参数传递给方法或存储在变量中。
简洁：无需像匿名类那样写很多模板代码。

lambda表达式基本语法：

（parameters）-> expression
或
（parameters）-> {statements；}

1
2
3

例子：

（1）（）->{}                           //有效，参数和返回值都为空
（2）（）->"Raoul"                      //有效，参数为空返回一个String
（3）（）->{return "Mario"；}           //有效，同上
（4）（Integeri）->return"跟上Java8"+i；//无效，是一个statement，要用{}括起来
（5）（String s）->{"跟上Java8"；}      //无效，不是一个有效的statement

1
2
3
4
5

# 在哪里以及如何使用lambda

可以且必须针对函数式接口（只有一个抽象方法的接口，空接口或者继承的接口不是函数式接口）使用lambda：

Runnable r1 = () -> System.out.println("Hello world");
Runnabel r2 = new Runnable{
    public void run(){
        System.out.println("Hello world");
    }
};

public static void process(Runnable r){
    r.run();
}

public static void main(String[] args){
    process(() -> System.out.println("Hello world"));
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14

函数描述符/lambda表达式的签名： (User, String) -> int

java.util.function中定义了许多函数式接口，例如Predicate<T>、Consumer<T>、Function<T,R>:

Predicate<String> nonEmptyStringPredicate = (String s) -> !s.empty();
List<String> nonEmpty = filter(listOFStrings, nonEmptyStringPredicate);

1
2

# Java 8中的常用函数式接口

函数式接口	函数描述符	原始类型特化
`Predicate<T>`	`T -> boolean`	`IntPredicate,LongPredicate, DoublePredicate`
`Consumer<T>`	`T -> void`	`IntConsumer,LongConsumer, DoubleConsumer`
`Function<T,R>`	`T -> R`	`IntFunction<R>, IntToDoubleFunction,` `IntToLongFunction, LongFunction<R>,` `LongToDoubleFunction, LongToIntFunction,` `DoubleFunction<R>, ToIntFunction<T>,` `ToDoubleFunction<T>, ToLongFunction<T>`
`Supplier<T>`	`() -> T`	`BooleanSupplier,IntSupplier, LongSupplier, DoubleSupplier`
`UnaryOperator<T>`	`T -> T`	`IntUnaryOperator, LongUnaryOperator, DoubleUnaryOperator`
`BinaryOperator<T>`	`(T,T) -> T`	`IntBinaryOperator, LongBinaryOperator, DoubleBinaryOperator`
`BiPredicate<L,R>`	`(L,R) -> boolean`
`BiConsumer<T,U>`	`(T,U) -> void`	`ObjIntConsumer<T>, ObjLongConsumer<T>, ObjDoubleConsumer<T>`
`BiFunction<T,U,R>`	`(T,U) -> R`	`ToIntBiFunction<T,U>, ToLongBiFunction<T,U>, ToDoubleBiFunction<T,U>`

# lambda和匿名内部类的区别

匿名内部类仍然是一个类，只是编译器会自动为该类取名，编译后会生成该类对应的class字节码文件；而lambda表达式在编译后会被封装成主类的一个私有方法，并通过invokedynamic指令调用。这样，我们就可以知道在lambda中的this指向的就是主类对象，而内部类中的this指向该内部类对象本身。

# Java集合框架（JCF）中的函数式接口

参考文章 (opens new window)

下表所示的是JCF一些接口在Java8中增加的新方法，他们大部分要用到java.util.function包下的接口，这意味着这些方法大部分跟lambda表达式有关。

接口名	在Java8中新加入的方法
Collection	removeIf() spliterator() stream() parallelStream() forEach()
List	replaceAll() sort()
Map	getOrDefault() forEach() replaceAll() putIfAbsent() remove() replace() computeIfAbsent() computeIfPresent() compute() merge()

# Collection接口

forEach()

该方法签名为void forEach(Consumer<? super E> action)，作用是对容器中的每个元素执行action指定的动作。

ArrayList<String> list = new ArrayList<>(Arrays.asList("I", "love", "you", "too"));
list.forEach( str -> {
        if(str.length()>3)
            System.out.println(str);
    });

1
2
3
4
5

removeIf()

该方法签名为boolean removeIf(Predicate<? super E> filter)，作用是删除容器中所有满足filter指定条件的元素。

ArrayList<String> list = new ArrayList<>(Arrays.asList("I", "love", "you", "too"));
list.removeIf(str -> str.length()>3); // 删除长度大于3的元素

1
2

replaceAll()

该方法签名为void replaceAll(UnaryOperator<E> operator)，作用是对每个元素执行operator指定的操作，并用操作结果来替换原来的元素。

ArrayList<String> list = new ArrayList<>(Arrays.asList("I", "love", "you", "too"));
list.replaceAll(str -> {
    if(str.length()>3)
        return str.toUpperCase();
    return str;
});

1
2
3
4
5
6

sort()

JDK1.7前该方法在Colections工具类中，方法签名为void sort(Comparator<? super E> c)，该方法根据c指定的比较规则对容器元素进行排序。

ArrayList<String> list = new ArrayList<>(Arrays.asList("I", "love", "you", "too"));
list.sort((str1, str2) -> str1.length()-str2.length());

1
2

此外，spliterator()方法返回容器的可拆分迭代器Spliterator<E>，该迭代器既可以逐个迭代，也可以通过调用自身trysplit()方法获得拆分后的另一半迭代器，可以通过多次调用trySplit()来分解负载便于多线程处理；stream()和parallelStream()返回该容器的Stream视图表示，Stream是Java函数式编程的核心类。

# Map接口

forEach()

Map接口中的forEach方法内使用的函数式接口时BiConsumer，其默认方法传入两个参数(Key,Value)->void。例如：输出Map中所有的映射关系：

HashMap<Integer, String> map = new HashMap<>();
map.put(1, "one");
map.put(2, "two");
map.put(3, "three");
map.forEach((k, v) -> System.out.println(k + "=" + v));
}

1
2
3
4
5
6

不过在昨天（7.15）做的试题中，我选择对整个entry集合根据value属性进行自定义堆排序，而结果又要求输出Key，所以需要以一个entry为单位进行操作，这时候用lambda表达式反而不方便了。

getOrDefault()

该方法没有用到函数式接口，不过也是1.8中新增的而且比较有用，作用是查询Map中是否有指定键值对应的Value，没有则返回一个默认Value。省去了查询指定键值是否存在的麻烦，例如昨天的题目中使用Map来统计每个网站的访问总次数和总时长：

Map<String, TimeAndCount> map = new HashMap<>();
while (scanner.hasNextLine()) {
    String record = scanner.nextLine();
    String[] details = record.split(" ");
    if (details.length != 3) break;
    TimeAndCount entry = map.getOrDefault(details[1],new TimeAndCount(0,0));
    entry.accessCount += 1;
    entry.totalTime += Integer.parseInt(details[2]);
    map.put(details[1],entry);
}

1
2
3
4
5
6
7
8
9
10

putIfAbsent()

该方法也没有用到函数接口，签名为 V putIfAbsent(K key,V value)，仅当不存在key值的映射或者映射为null时才把value值放到map中，否则不放入value。返回之前key映射的值。

remove(K,V)

1.7及之前，可以根据Key删除映射关系，1.8新增了remove(K,V)方法，仅当对应的映射关系存在时才删除。

replace()

1.7及之前，要实现替换可以使用put用新值替换旧值，1.8新增了两个replace()方法：

replace(K,V)：只有K在map中存在映射时才将value替换为V。
replace(K,oldV,newV)：只有map中存在映射(K,oldV)时才将oldV替换为newV。

replaceAll()

该方法作用是对Map中的每个映射执行function指定的操作，并用function的执行结果替换原来的value。例如：假设有一个数字到对应英文单词的Map，请将原来映射关系中的单词都转换成大写。如果使用匿名内部类的方式写法为：

HashMap<Integer, String> map = new HashMap<>();
map.put(1, "one");
map.put(2, "two");
map.put(3, "three");
map.replaceAll(new BiFunction<Integer, String, String>(){
    @Override
    public String apply(Integer k, String v){
        return v.toUpperCase();
    }
});

1
2
3
4
5
6
7
8
9
10

现在使用lambda表达式：

HashMap<Integer, String> map = new HashMap<>();
map.put(1, "one");
map.put(2, "two");
map.put(3, "three");
map.replaceAll((k, v) -> v.toUpperCase());

1
2
3
4
5

merge()

该方法签名为merge(K key, V value, BiFunction<? super V,? super V,? extends V> remappingFunction)，是将value合并到key的映射上，如果key的映射不存在或者为null则将value映射到key上，否则将原来的valueOld和新value作为参数传给BiFunction，将新的计算结果映射到key。如果新结果为null则删除映射。例如要拼接错误信息：

map.merge(key, newMsg, (v1, v2) -> v1+v2);

compute()

该方法签名为compute(K key, BiFunction<? super K,? super V,? extends V> remappingFunction)，作用是把remappingFunction的计算结果关联到key上，如果计算结果为null，则在Map中删除key的映射。上面的merge也可以用compute来实现：

map.compute(key, (k,v) -> v==null ? newMsg : v.concat(newMsg));

computeIfAbsent()与computeIfPresent

computeIfAbsent()的签名为V computeIfAbsent(K key, Function<? super K,? extends V> mappingFunction)，作用是在map中不存在key时，建立key到Function计算出的Value的映射。否则返回之前的value。

computeIfPresent()签名为V computeIfPresent(K key, BiFunction<? super K,? super V,? extends V>，只有在当前Map中存在key值的映射且非null时，才调用remappingFunction。如果remappingFunction执行结果为null，则删除key的映射，否则使用该结果替换key原来的映射。

@Test
public void test() {
    Map<Integer, Set<String>> map = new HashMap<>();
    //不存在则创建映射
    map.computeIfAbsent(1,v->new HashSet<>()).add("yes");
    //存在则返回原value
    map.computeIfAbsent(1,v->new HashSet<>()).add("or");
    //存在则用新映射替换原来的映射
    map.computeIfPresent(1,(k,v)->new HashSet<>()).add("no");
    map.forEach((k,v)-> System.out.println(v));
}

1
2
3
4
5
6
7
8
9
10
11

# Stream API

Java 8之所以费这么大功夫引入函数式编程，原因有二：

代码简洁函数式编程写出的代码简洁且意图明确，使用stream接口让你从此告别for循环。
多核友好，Java函数式编程使得编写并行程序非常简单，开发者要做的只是调用一下parallel()方法。

stream并不是某种数据结构，它只是数据源的一种视图。这里的数据源可以是一个数组，Java容器或I/O channel等。正因如此要得到一个stream通常不会手动创建，而是调用对应的工具方法，比如：

调用Collection.stream()或者Collection.parallelStream()方法
调用Arrays.stream(T[] array)方法

Java有4中stream接口继承自BaseStream，分别是IntStream、LongStream、DoubleStream和Stream，其中前三个对应三种基本类型，Stream对应剩余的基本类型和引用类型。为不同数据类型设置不同stream接口，可以提高性能并增加特定接口函数。

# Stream的特点

虽然大部分情况下stream是容器调用Collection.stream()方法得到的，但stream和collections有以下不同：

无存储。stream不是一种数据结构，它只是某种数据源的一个视图，数据源可以是一个数组，Java容器或I/O channel等。
为函数式编程而生。对stream的任何修改都不会修改背后的数据源，比如对stream执行过滤操作并不会删除被过滤的元素，而是会产生一个不包含被过滤元素的新stream。
惰式执行。stream上的操作并不会立即执行，只有等到用户真正需要结果的时候才会执行。
可消费性。stream只能被“消费”一次，一旦遍历过就会失效，就像容器的迭代器那样，想要再次遍历必须重新生成。

对stream的操作分为为两类，中间操作(intermediate operations)和结束操作(terminal operations)，二者特点是：

中间操作总是会惰式执行，调用中间操作只会生成一个标记了该操作的新stream，仅此而已。
结束操作会触发实际计算，计算发生时会把所有中间操作积攒的操作以pipeline的方式执行，这样可以减少迭代次数。计算完成之后stream就会失效。

# Stream的接口方法

操作类型	接口方法
中间操作	concat() distinct() filter() flatMap() limit() map() peek() skip() sorted() parallel() sequential() unordered()
结束操作	allMatch() anyMatch() collect() count() findAny() findFirst() forEach() forEachOrdered() max() min() noneMatch() reduce() toArray()

常用中间操作接口简介：

filter()传入一个断言式接口，根据λ表达式返回的布尔值来筛选要保留的元素；distinct()作用是返回一个去除重复元素后的stream；sorted()可以传入一个比较器接口（或不传就按照自然顺序），返回排序后的stream；map()传入一个转换式接口，将视图中的元素按照自定规则转换为新的元素（类型可能按需改变）；flatMap()作用是将原Stream中所有元素都摊平后组成一个新的Stream，例如：

Stream<List<Integer>> stream = Stream.of(Arrays.asList(1,2), Arrays.asList(3, 4, 5));
stream.flatMap(list -> list.stream())
    .forEach(i -> System.out.println(i));

1
2
3

注意这些接口方法都是中间操作，调用后并不会立即进行计算或输出结果。

# Stream流规约

规约操作（reduction operation）又被称作折叠操作（fold），是通过某个连接动作将所有元素汇总成一个汇总结果的过程。元素求和、求最大值或最小值、求出元素总个数、将所有元素转换成一个列表或集合，都属于规约操作。Stream类库有两个通用的规约操作reduce()和collect()，也有一些为简化书写而设计的专用规约操作，比如sum()、max()、min()、count()等。规约操作属于结束操作。

reduce()

reduce操作可以实现从一组元素中生成一个值，调用时传入一个BinaryOperator接口，其作用是传入两个同类的参数，根据一定标准选择一个或者创建一个同类的元素并返回。有三种重载写法

Optional<T> reduce(BinaryOperator<T> accumulator)
T reduce(T identity, BinaryOperator<T> accumulator)
<U> U reduce(U identity, BiFunction<U,? super T,U> accumulator, BinaryOperator<U> combiner)

1
2
3

例如找出最长的单词:

Stream<String> stream = Stream.of("I", "love", "you", "too");
Optional<String> longest = stream.reduce((s1, s2) -> s1.length()>=s2.length() ? s1 : s2);
//Optional<String> longest = stream.max((s1, s2) -> s1.length()-s2.length());
System.out.println(longest.get());

1
2
3
4

求单词长度之和:


Stream<String> stream = Stream.of("I", "love", "you", "too");
Integer lengthSum = stream.reduce(0,　// 初始值　// (1)
        (sum, str) -> sum+str.length(), // 累加器 // (2)
        (a, b) -> a+b);　// 部分和拼接器，并行执行时才会用到 // (3)
// int lengthSum = stream.mapToInt(str -> str.length()).sum();
System.out.println(lengthSum);

1
2
3
4
5
6
7

collect()

collect()是Stream接口方法中最灵活的一个，学会它才算真正入门Java函数式编程。我短时间内消化能力确实有限，暂时只能学到这里了。。

// 将Stream转换成容器或Map
Stream<String> stream = Stream.of("I", "love", "you", "too");
List<String> list = stream.collect(Collectors.toList()); // (1)
// Set<String> set = stream.collect(Collectors.toSet()); // (2)
// Map<String, Integer> map = stream.collect(Collectors.toMap(Function.identity(), String::length)); // (3)

1
2
3
4
5

# 方法引用

诸如String::length的语法形式叫做方法引用（method references），这种语法用来替代某些特定形式Lambda表达式。如果Lambda表达式的全部内容就是调用一个已有的方法，那么可以用方法引用来替代Lambda表达式。方法引用可以细分为四类：

方法引用类别	举例
引用静态方法	Integer::sum
引用某个对象的方法	list::add
引用某个类的方法	String::length
引用构造方法	HashMap::new

Wallace's Blog

Choose mode