一:背景

1. 讲故事

前段时间将公司的一个项目从 4.5 升级到了 framework 4.8 ,编码的时候发现 Enumerable 中多了三个扩展方法: Append, Prepend, ToHashSet,想必玩过jquery的朋友一眼就能看出这三个方法的用途,这篇就和大家一起来聊聊这三个方法的底层源码实现,看有没有什么新东西可以挖出来。

二:Enumerable 下的新扩展方法

1. Append

看到这个我的第一印象就是 Add 方法, 可惜在 Enumerable 中并没有类似的方法,可能后来程序员在这块的呼声越来越高,C#开发团队就弥补了这个遗憾。

<1> 单条数据的追加

接下来我写一个小例子往集合的尾部追加一条数据,如下代码所示:

static void Main(string[] args)
        {
            var arr = new int[2] { 1, 2 };

            var result = Enumerable.Append(arr, 3);

            foreach (var item in result)
            {
                Console.WriteLine(item);
            }
        }

Enumerable 下又有新的扩展方法啦,快来一起一睹为快吧_Enumerable

逻辑还是非常清晰的,再来看看底层源码是怎么实现的。

public static IEnumerable<TSource> Append<TSource>(this IEnumerable<TSource> source, TSource element)
{
	if (source == null)
	{
		throw Error.ArgumentNull("source");
	}
	AppendPrependIterator<TSource> appendPrependIterator = source as AppendPrependIterator<TSource>;
	if (appendPrependIterator != null)
	{
		return appendPrependIterator.Append(element);
	}
	return new AppendPrepend1Iterator<TSource>(source, element, appending: true);
}


private class AppendPrepend1Iterator<TSource> : AppendPrependIterator<TSource>
{
    public AppendPrepend1Iterator(IEnumerable<TSource> source, TSource item, bool appending) : base(source)
	{
		_item = item;
		_appending = appending;
	}

    public override bool MoveNext()
	{
		switch (state)
		{
		case 1:
			state = 2;
			if (!_appending)
			{
				current = _item;
				return true;
			}
			goto case 2;
		case 2:
			GetSourceEnumerator();
			state = 3;
			goto case 3;
		case 3:
			if (LoadFromEnumerator())
			{
				return true;
			}
			if (_appending)
			{
				current = _item;
				return true;
			}
			break;
		}
		Dispose();
		return false;
	}

}

从上面的源码来看,这玩意做的还是挺复杂的,继承关系依次是: AppendPrepend1Iterator<TSource> -> AppendPrependIterator<TSource> -> Iterator<TSource>, 这里大家要着重看一下 MoveNext() 里面的两个方法 GetSourceEnumerator() 和 LoadFromEnumerator(),如下代码所示:

Enumerable 下又有新的扩展方法啦,快来一起一睹为快吧_Enumerable_02

可以看到,第一个方法用于获取 Array 这个数据源,下面这个方法用于遍历这个 Array,当 foreach 遍历完之后,执行 case 3 语句,也就是下面的 if 语句,将你追加的 3 迭代一下,如下图:

Enumerable 下又有新的扩展方法啦,快来一起一睹为快吧_Enumerable_03

<2> 批量数据的追加

我们知道集合的添加除了 Add 还有 AddRange,很遗憾,Enumerable下并没有找到类似的 AppendRange 方法,那如果要实现 AppendRange 操作该怎么处理呢? 哈哈,只能自己 foreach 迭代啦,如下代码:

static void Main(string[] args)
        {
            var arr = new int[2] { 1, 2 };

            var arr2 = new int[3] { 3, 4, 5 };

            IEnumerable<int> collection = arr;

            foreach (var item in arr2)
            {
                collection = collection.Append(item);
            }
            foreach (var item in collection)
            {
                Console.WriteLine(item);
            }
        }

Enumerable 下又有新的扩展方法啦,快来一起一睹为快吧_Enumerable_04

结果也是非常简单的,因为 IEnumerable 是非破坏性的操作,所以你需要在 Append 之后用类型给接住,接下来找一下底层源码。

public static IEnumerable<TSource> Append<TSource>(this IEnumerable<TSource> source, TSource element)
{
	if (source == null)
	{
		throw Error.ArgumentNull("source");
	}
	AppendPrependIterator<TSource> appendPrependIterator = source as AppendPrependIterator<TSource>;
	if (appendPrependIterator != null)
	{
		return appendPrependIterator.Append(element);
	}
	return new AppendPrepend1Iterator<TSource>(source, element, appending: true);
}

private class AppendPrepend1Iterator<TSource> : AppendPrependIterator<TSource>
{
    public override AppendPrependIterator<TSource> Append(TSource item)
	{
		if (_appending)
		{
			return new AppendPrependN<TSource>(_source, null, new SingleLinkedNode<TSource>(_item).Add(item), 0, 2);
		}
		return new AppendPrependN<TSource>(_source, new SingleLinkedNode<TSource>(_item), new SingleLinkedNode<TSource>(item), 1, 1);
	}
}

private class AppendPrependN<TSource> : AppendPrependIterator<TSource>
{
	public override AppendPrependIterator<TSource> Append(TSource item)
	{
		SingleLinkedNode<TSource> appended = (_appended != null) ? _appended.Add(item) : new SingleLinkedNode<TSource>(item);
		return new AppendPrependN<TSource>(_source, _prepended, appended, _prependCount, _appendCount + 1);
	}
}

从上面的代码可以看出,当你 Append 多次的时候,本质上就是多次调用 AppendPrependN<TSource>.Append() ,而且在调用的过程中,一直将你后续添加的元素追加到 SingleLinkedNode 单链表中,这里要注意的是 Add 采用的是 头插法,所以最后插入的元素会在队列头部,如下图:

Enumerable 下又有新的扩展方法啦,快来一起一睹为快吧_Enumerable_05

如果你不信的话,我可以在 vs 调试中给您展示出来。

Enumerable 下又有新的扩展方法啦,快来一起一睹为快吧_Enumerable_06

貌似说的有点啰嗦,最后大家观察一下 AppendPrependN<TSource>.MoveNext 的实现就可以了。

Enumerable 下又有新的扩展方法啦,快来一起一睹为快吧_Enumerable_07

说了这么多,我想你应该明白了哈。

2. Prepend

本质上来说 Prepend 和 Append 是一对的,一个是在前面插入,一个是在后面插入,不要想歪了,如果你细心的话,你会发现 Prepend 也是用了这三个类: AppendPrepend1Iterator<TSource>,AppendPrependIterator<TSource>,AppendPrependN<TSource> 以及 单链表 SingleLinkedNode<TSource>,这个就留给大家自己研究了哈。

3. ToHashSet

我以前在全内存开发中会频繁的用到 HashSet,毕竟它的时间复杂度是 O(1) ,而且在 Enumerable 中早就有了 ToList 和 ToDictionary,凭啥没有 ToHashSet,在以前只能将 source 塞到 HashSet 的构造函数中,如: new HashSet<int>(source) ,想想也是够奇葩的哈,而且我还想吐糟一下的是居然到现在还没有 AddRange 批量添加方法,气人哈,接下来用 ILSpy 看一下这个扩展方法是如何实现的。

Enumerable 下又有新的扩展方法啦,快来一起一睹为快吧_Enumerable_08

三: 总结

总体来说这三个方法还是很实用的,我相信在后续的版本中 Enumerable 下的扩展方法还会越来越多,越来越人性化,人生苦短, 我用C#。