本节会详解介绍如何使用流,以发挥出它的强大功能,主要包括:
1)筛选,切片,映射
2)查找,匹配和归约
3)使用数值范围等数值流
4)从多个源创建流
5)无限流

筛选和切片
用谓词筛选

Stream接口支持filter方法,该方法接收Predicate谓词,而Predicate之前已经介绍了是函数式接口,所以我们可以很方便的传递lambda,对流元素做筛选。

筛除重复的元素

类似sql中的distinct关键字,Stream接口也提供了distinct方法,用于将重复元素过滤出去,如:

List<Integer> numbers = Arrays.asList(1, 2, 3, 3, 4, 5);
numbers.stream().distinct().forEach(System.out::println);

// result: 1,2,3,4,5
截断流

通过limit(n)方法,会返回一个不超过给定长度的流。示例:

List<Dish> dishes = menu.stream().filter(e -> e.getCalories() > 300).limit(3).collect(toList());

// 只筛选出符合谓词的前三个元素就立即返回结果,实现了截断效果
跳过元素

用的比较少,如可以跳过指定个数的元素:skip(n)。 如果流中元素不足n个,则返回一个空流。示例:

List<Dish> dishes = menu.stream().filter(e -> e.getCalories() > 300).skip(1).collect(toList());
映射(map)

这是一个非常常用的功能,如取对象某个属性再做处理,就像sql中取某一列。

对流中的每一个元素应用函数

Stream支持map()方法,接收一个函数(Function),这个函数会被应用到每个元素上,并将其映射为新的元素。注意调用map()方法后会改变流的类型,变成映射后新元素的类型。如:

List<String> dishes = menu.stream().filter(e -> e.getCalories() > 300).map(Dish::getName).collect(toList());
流的扁平化

有时候需要实现这样的功能:
对于一张单 词表,如何返回一张列表,列出里面各不相同的字符呢?例如,给定单词列表 [“Hello”,“World”],你想要返回列表[“H”,“e”,“l”, “o”,“W”,“r”,“d”]。
只用map无法解决,你可能想这样实现:

words.stream().map(w -> w.split("")).distinct().collect(toList());

但实际达不到需要的效果,因为调用map后生成的流类型是Stream<String[]>, 而我们期望的是Stream<String>。这时需要用到flatMap来解决。

words.stream()
     .map(w -> w.split(""))
     .flatMap(Arrays::stream) // 流的扁平化:将多个流合并为一个流
     .distinct()
     .collect(Collectors.toList());
查找和匹配

一个常见的数据处理操作是看集合中是否有满足某个条件的数据。Stream API通过allMatch, anyMatch, noneMatch, findFirst, finaAny方法提供了类似功能。

检查至少匹配一个(anyMatch)
public class MatchSample {

    public static void main(String[] args) {
        List<Dish> menus = new ArrayList<>(List.of(
                new Dish("大虾", 100),
                new Dish("大鱼", 200),
                new Dish("大兔", 300),
                new Dish("大狗", 400),
                new Dish("大猪", 500)
        ));

        boolean match = menus.stream().anyMatch(e -> e.getCalories() > 300);

        if (match) {
            System.out.println("存在卡路里大于300的食物");
        }
    }
}
所有流元素都匹配(AllMatch)
public class AllMatchSample {

    public static void main(String[] args) {
        List<Dish> menus = new ArrayList<>(List.of(
                new Dish("大虾", 100),
                new Dish("大鱼", 200),
                new Dish("大兔", 300),
                new Dish("大狗", 400),
                new Dish("大猪", 500)
        ));

        boolean match = menus.stream().allMatch(e -> e.getCalories() > 300);

        if (match) {
            System.out.println("所有食物卡路里大于300");
        } else {
            System.out.println("不是所有食物卡路里大于300");

        }
    }
}
所有流元素都不匹配(NoneMatch)
public class NoneMatchSample {

    public static void main(String[] args) {
        List<Dish> menus = new ArrayList<>(List.of(
                new Dish("大虾", 100),
                new Dish("大鱼", 200),
                new Dish("大兔", 300),
                new Dish("大狗", 400),
                new Dish("大猪", 500)
        ));

        boolean match = menus.stream().noneMatch(e -> e.getCalories() > 300);

        if (match) {
            System.out.println("所有食物卡路里都不大于300");
        } else {
            System.out.println("有食物卡路里大于300");

        }
    }
}
查找元素
Optional介绍

java.util.Optional<T>是一个容器类,java8新加入,可代表一个值存在or不存在,引入的目的是为了避免直接返回null。
Optional中几个常见的方法:
1)isPresent(),将在包含值时返回true,反之返回false
2) ifPresent(Consumer<T> c) 会在值存在时执行指定的消费逻辑
3)T get() 会在值存在时返回值,否则返回NoSuchElement异常
4)T orElse(T other)会在值存在时返回值本身,否则返回一个默认值other。

如需要实现如下功能:

// 打印任意一个卡路里大于400的菜肴
menu.stream()
    .filter(e -> e.getCalaris() > 400)
    .findAny()
    .ifPresent(e -> System.out.println(e.getName()));
查找第一个元素&任意元素

findFirst: 查走第一个元素
findAny: 查找任意一个元素

// 打印任意一个卡路里大于400的菜肴
menu.stream()
    .filter(e -> e.getCalaris() > 400)
    .findAny()
    .ifPresent(e -> System.out.println(e.getName()));

// 打印第一个卡路里大于400的菜肴
menu.stream()
    .filter(e -> e.getCalaris() > 400)
    .findFirst()
    .ifPresent(e -> System.out.println(e.getName()));

findFirst vs findAny
当明确需要取首元素时使用findFirst,否则用findAny即可。因为它在使用并行流时限制较少。

规约(Reduce)

目前用过的流终端操作有:
1)返回boolean型:anyMatch, allMatch, NoneMatch
2) 返回void: forEach
3)返回Integer: count
4) 返回Optional: findFirst, findAny
5)返回集合:collect(toList)

下面介绍一种新的终端操作:reduce。即可以使用归约操作将流中的元素组合起来,实现强大的功能。如计算菜肴的总卡路里,或挑选出卡路里最高的菜。

元素求和

示例如下:

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
int sum = numbers.stream().reduce(0, (a, b) -> a + b);

reduce接收两个参数:
1)一个初始值,这里是0
2)一个BinaryOperator<T>将两个元素结合起来产生一个新值。

整体过程如下:
1)首先0作为第一个参数a的值,从流中取出值作为b的值,执行求和得到累计值。
2)将累计值作为a的值,再去流中下一个元素作为b的值,再执行求和得到累计值。
3)依次迭代直到流中最后一个元素,终止,得到最后的归约结果。

元素求最大,最小
// 求最大值
public class MaxReduceSample {

    public static void main(String[] args) {
        List<Dish> menus = new ArrayList<>(List.of(
                new Dish("大虾", 100),
                new Dish("大鱼", 200),
                new Dish("大兔", 300),
                new Dish("大狗", 400),
                new Dish("大猪", 500)
        ));
        
        //Integer maxCalories = menus.stream().map(Dish::getCalories).reduce(0, (i, j) -> i > j ? i : j);
        Integer maxCalories = menus.stream().map(Dish::getCalories).reduce(0, Integer::max);
        System.out.println(maxCalories);
    }
}

求最小值不再举例,写法几乎一致

map-reduce通常一起用,称为map-reduce模式, 因Google用它来进行网络搜索而出名,因为它很容易并行化

目前已了解的中间操作和终端操作汇总

java stream处理字段_java

数值流

还是先看下求和的例子:

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);
int sum = numbers.stream().reduce(0, (a, b) -> a + b);

此种写法能计算出结果,但隐含了自动拆箱装箱,浪费了性能。为此引入了三个针对原始类型的流接口来解决这个问题,分别是:IntStream, DoubleStream和LongStream,分别将流中的元素转化为int, double和long,从而避免了暗含的自动装箱成本。

常见操作如下:

映射到数值流

将流转化为特定版本数值流的方法如下:mapToInt, mapToDouble和mapToLong。转化为数值流后可使用一些快捷方法完成计算:

// 更快捷的计算总卡路里
int sum = menu.stream().mapToInt(Dish::getCalories).sum();

// 还支持如max, min, average等常见方法
转化回对象流

数值流类型是IntStream, DoubleStream和LongStream, 某些场景下又想转化回对象流Stream<T>,可执行如下操作:

IntStream i = menu.stream().mapToInt(Dish::getCalories);

// return to Stream<T>
Stream<Integer> s = i.boxed();
默认值OptionalInt

对于数值流,也有三个Optional特殊版本,分别是OptionalInt, OptionalDouble和OptionalLong。

例如:要找到IntStream中的最大值,可以调用max方法,会返回一个OptionalInt:

OptionalInt i = menu.stream().mapToInt(Dish::getCalories).max();
int max = i.orElse(1);
数值范围生成流

IntStream.range(start, end): 可用来生成数值范围序列。
IntStream.rangeClosed(start, end): 可用来生成数值范围序列。

两者的区别是:range不包含end, rangeClosed包含end。

示例:

long total = IntStream.range(0, 100).filter(e -> e % 2 == 0).count();
System.out.println(total);
// result: 50

long total = IntStream.rangeClosed(0, 100).filter(e -> e % 2 == 0).count();
System.out.println(total);
// result: 51
由值创建流

示例:

Stream<String> stream = Stream.of("Java 8 ", "Lambdas ", "In ", "Action"); stream.map(String::toUpperCase).forEach(System.out::println);

可初始化一个空流

Stream<String> emptyStream = Stream.empty();
由数组创建流(常用)
Arrays.stream(new String[]{"a", "b", "c"})
由文件生成流

java.nio.file.Files有很多静态方法支持返回一个流。如下面的示例用于返回一个文本文件中不同单词的个数。

/**
 * 演示从文本文件获取流,做相应处理
 */
public class FileStreamSample {

    public static void main(String[] args) {
        // Stream接口天生实现了AutoCloseable接口,所有可以使用try...with...resource语法
        try(Stream<String> lines = Files.lines(Paths.get("/Users/liupeijun/git/learn/1.txt"))) {
            // 使用流的flatMap方法扁平化流
            long count = lines.flatMap(e -> Arrays.stream(e.split(" "))).distinct().count();
            System.out.println(count);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }
}
由函数生成流:创建无限流

StreamAPI提供了两个静态方法来从函数生成流:Stream.iterate和Stream.generte来创建无限流。它们都是按需创建值,如果不加限制可以一直计算下去,所有一般都要加上 限制limit(n),以避免打印无穷多个值。

iterate
示例如下:

// 生成一个从0开始的偶数序列流,限制最大生成100个序列
Stream.iterate(0, n -> n + 2).limit(100).forEach(System.out::println);

// result: 0, 2, 4, 6, ..., 198

iterate第一参数是初始值,第二个参数是UnaryOperator<T>类型。

一个实用示例:生成斐波那契数列
格式是:[[0, 1], [1, 2], [2, 3], [3, 5] …]

public class FibonacciSample {

    public static void main(String[] args) {
        Stream.iterate(new long[]{0, 1}, t -> new long[]{t[1], t[0] + t[1]})
                .limit(80)
                .forEach(e -> System.out.println("[" + e[0] + "," + e[1] + "]"));
    }
}
//result:
[0,1]
[1,1]
[1,2]
[2,3]
[3,5]
[5,8]
[8,13]
[13,21]
[21,34]
...

generate
也可以按需生成一个无限流,但不是依次对每个新生成的值应用函数,它接收一个Supplier<T>提供新值,如:

Stream.generate(Math::random)
          .limit(5)
          .forEach(System.out::println);
// result:
 0.9410810294106129
 0.6586270755634592
 0.9592859117266873
 0.13743396659487006
 0.3942776037651241

具体generate的进一步应用,这里不再展开。

小结

本节系统学习了如何使用流,能更高效的处理集合了。总结一下知识点:
1)可以使用filter, distinct, skip,limit对流做筛选和切片
2)可以使用map和flatMap做映射和流的扁平化
3)可以使用findFirst和findAny查找流中元素
4)可以使用allMatch, anyMatch, noneMatch查询是否匹配
5)可以利用map-reduce模式实现流元素的归约,如求和,最大,最小等
6)区分有状态操作(reduce, sorted, distinct)和无状态操作(map, filter)
7) 从数组,集合,文件创建流;无限流(iterate,generate)