1.Hashtable
哈希表(HashTable)表示键/值对的集合。在.NET Framework中,Hashtable是System.Collections命名空间提供的一个容器,用于处理和表现类似key-value的键值对,其中key通常可用来快速查找,同时key是区分大小写;value用于存储对应于key的值。Hashtable中key-value键值对均为object类型,所以Hashtable可以支持任何类型的keyvalue键值对,任何非 null 对象都可以用作键或值。
2.HashSet类
主要是设计用来做高性能集运算的,例如对两个集合求交集、并集、差集等。集合中包含一组不重复出现且无特性顺序的元素,HashSet拒绝接受重复的对象。
HashSet的一些特性如下:
a. HashSet中的值不能重复且没有顺序。
b. HashSet的容量会按需自动添加。
3.Dictionary
他本身有集合的功能有时候可以把它看成数组
他的结构是这样的:Dictionary<[key], [value]>
他的特点是存入对象是需要与[key]值一一对应的存入该泛型
通过某一个一定的[key]去找到对应的值
Hashtable 与 Dictionary
第一、存储的数据类型
Hashtable不是泛型的,不是类型安全的;Dictionary是泛型的,是类型安全的;
Hashtable的键值都是Object类型的,但是Dictionary的键值的数据类型是可以指定的。
也就是说如果往Hashtable里面存入Object以外的数据类型,则在取出该数据时,需要对其进行显示的类型转换,才能够正常使用。而Dictionary则没有这个问题。
从这方面讲的话,Hashtable相当于Dictionary<Object,Object>
Hashtable ht = new Hashtable();
Dictionary<string, int> dic = new Dictionary<string, int>();
ht.Add("A", 1);
dic.Add("A", 1);
//Console.WriteLine(ht["A"]+1); //编译错误!Object类型不能和int类型直接进行相加。
Console.WriteLine((int)ht["A"] + 1);//编译通过,输出结果为:2
Console.WriteLine(dic["A"] + 1);
第二、读取数据的顺序与添加数据的顺序的一致性
Dictionary和Hashtable的读取数据的顺序和添加数据时的数据的顺序的一致性均不能够保证,或者可以说没有一致性。
Dictionary在只添加不删除的时候能够保持读取数据的顺序和添加时候的顺序是一致的;但是经过删除和添加操作之后,就不能够保证读取数据的顺序和添加时候的顺序一致了。
Dictionary<int, int> dic = new Dictionary<int, int>();
dic.Add(0, 0);
dic.Add(1, 1);
dic.Add(2, 2);
Console.WriteLine("仅仅经过添加元素处理之后:");
foreach (KeyValuePair<int, int> kvp in dic)
{
Console.WriteLine("Key:" + kvp.Key + " Value:" + kvp.Value);
}
dic.Remove(0);
dic.Add(3, 3);
Console.WriteLine("经过删除和添加元素处理之后:");
foreach (KeyValuePair<int, int> kvp in dic)
{
Console.WriteLine("Key:" + kvp.Key + " Value:" + kvp.Value);
}
对于Dicitionary而言,如果从中删除一个元素,则之后新添加的元素会填补这个被删除元素的位置,因而致使添加数据的顺序与读取数据的顺序是不一致的。
对于Hashtable而言,它的数据存储顺序是按一定的算法算出来的,所以绝大多数情况下,它的数据读取顺序和数据添加顺序是不一致的。
所以如果你需要保持数据添加时的顺序的时候,最好不要用Dictionary和Hashtable。
第三、当用一个不存在的Key值到Hashtable或者Dictionary中取值时
对于Hashtable而言,如果用一个不存在的Key值进行取值的话,会返回一个null;
Hashtable ht = new Hashtable();
Console.WriteLine(ht["b"]==null);
对于Dictionary而言,如果用一个不存在的Key值进行取值的话,会引发“System.Collections.Generic.KeyNotFoundException”类型的异常。
所以在从Dictionary或者Hashtable取值时,可以先判断Key值是否存在(用ContainsKey()方法进行判断),以防止出现预期以外的值或者异常。
第四、线程安全性
Dictionary不是线程安全的,Hashtable是线程安全的。对 Hashtable 进一步调用 Synchronized() 方法可以获得完全线程安全的类型. 而 Dictionary 非线程安全, 必须人为使用 lock 语句进行保护, 效率大减。
HashSet代替List问题
NET3.5多了个HasSet<T>用来存储集合。从名称可以看出,它是基于Hash的。可以简单理解为没有Value的Dictionary<TKey,TValue>。
HashSet<T>不能用索引访问,不能存储重复数据,元素T必须正确实现了Equals和GetHashCode。
那它的优势是什么呢?
检索的性能。简单的说它的Contains方法的性能在大数据量时比List<T>好得多。HashSet<T>的Contains方法复杂度是O(1),List<T>的Contains方法复杂度是O(n)。
那么,在集合的目的是为了检索的情况下,我们应该使用HashSet<T>代替List<T>。比如一个存储关键字的集合,运行的时候通过其Contains方法检查输入字符串是否关键字。
HashSet<T>是专门设计用来做集合运算(取交集,并集等),所以提供了UnionWith、IntersectWith等方法。
另:如果数据量很小,那么任然推荐使用List<T>。
这个“小”是多小呢?其实是用Hashtable还是ListDictionary时存在同样的取舍问题,.NET为其设计了HybridDictionary类实现一个混合容器,当数量小于等于8(目前是8,不保证微软以后不会变)的时候,HybridDictionary内部使用ListDictionary,当数量大于8的时候,HybridDictionary内部使用Hashtable。所以,如果我们知道我们集合的数量不会大于8的话,就算目的是为了检索,任然推荐使用List<T>。
由于 Hashtable 和 Dictionary 同时存在, 在使用场景上必然存在选择性, 并不任何时刻都能相互替代.
[1] 单线程程序中推荐使用 Dictionary, 有泛型优势, 且读取速度较快, 容量利用更充分.
[2] 多线程程序中推荐使用 Hashtable, 默认的 Hashtable 允许单线程写入, 多线程读取, 对 Hashtable 进一步调用 Synchronized() 方法可以获得完全线程安全的类型. 而 Dictionary 非线程安全, 必须人为使用 lock 语句进行保护, 效率大减.
[3] Dictionary 有按插入顺序排列数据的特性 (注: 但当调用 Remove() 删除过节点后顺序被打乱), 因此在需要体现顺序的情境中使用 Dictionary 能获得一定方便.
C# HashSet 用法
.NET 3.5在System.Collections.Generic命名空间中包含一个新的集合类:HashSet。这个集合类包含不重复项的无序列表。这种集合称为“集(set)”。集是一个保留字,所以该类有另一个名称HashSet。这个名称很容易理解,因为这个集合基于散列值,插入元素的操作非常快,不需要像List类那样重排集合。
HashSet类提供的方法可以创建合集和交集。
在示例代码中,创建了3个字符串类型的新集,并用一级方程式汽车填充。HashSet类实现了ICollection接口。但是在该类中,Add()方法是显式实现的,还提供了另一个Add()方法。Add()方法的区别是返回类型,它返回一个布尔值,说明是否添加了元素。如果该元素已经在集中,就不添加它,并返回false。
HashSet < string > companyTeams =new HashSet < string > (){ "Ferrari", "McLaren", "Toyota", "BMW","Renault", "Honda" };
HashSet < string > traditionalTeams =new HashSet < string > (){ "Ferrari", "McLaren" };
HashSet < string > privateTeams =new HashSet < string > (){ "Red Bull", "Toro Rosso", "Spyker","Super Aguri" };
if (privateTeams.Add("Williams"))
Console.WriteLine("Williams added");
if (!companyTeams.Add("McLaren"))
Console.WriteLine("McLaren was already in this set");
两个Add()方法的输出写到控制台上:
Williams added
McLaren was already in this set
方法IsSubsetOf()和IsSupersetOf()比较集和实现了IEnumerable接口的集合,返回一个布尔结果。这里,IsSubsetOf()验证traditionalTeams中的每个元素是否都包含在companyTeams中,IsSupersetOf()验证traditionalTeams是否没有与companyTeams比较的额外元素。
if (traditionalTeams.IsSubsetOf(companyTeams))
{
Console.WriteLine("traditionalTeams is " +"subset of companyTeams");
}if (companyTeams.IsSupersetOf(traditionalTeams))
{
Console.WriteLine("companyTeams is a superset of " +"traditionalTeams");
}
这个验证的结果如下:
traditionalTeams is a subset of companyTeams
companyTeams is a superset of traditionalTeams
HashSet 用法
.NET 3.5在System.Collections.Generic命名空间中包含一个新的集合类:HashSet。这个集合类包含不重复项的无序列表。这种集合称为“集(set)”。集是一个保留字,所以该类有另一个名称HashSet。这个名称很容易理解,因为这个集合基于散列值,插入元素的操作非常快,不需要像List类那样重排集合。
HashSet类提供的方法可以创建合集和交集。
创建HashSet:
HashSet hs = new HashSet();
HashSet companyTeams = new HashSet() { “Ferrari”, “McLaren”, “Toyota”, “BMW”, “Renault”, “Honda” };
HashSet改变集的值的方法:
Add(): 如果某元素不在集合中,Add()方法就把该元素添加到集合中。在其返回值Boolean中,返回元素是否添加的信息
eg:
if (!companyTeams.Add(“McLaren”))
Console.WriteLine(“McLaren was already in this set”);
Clear():方法Clear()删除集合中的所有元素
eg: companyTeams.Clear();
Remove():Remove()方法删除指定的元素
eg: companyTeams.Remove(“McLaren”);
RemoveWhere(): RemoveWhere()方法需要一个Predicate委托作为参数。删除满足谓词条件的所有元素
Predicate 可以委托给一个函数或者一个拉姆达表达式:
委托给拉姆达表达式:
eg:
companyTeams.RemoveWhere(company => { if (company.Length > 5) { return true; } else { return false; } });
委托给一个函数:
eg:
companyTeams.RemoveWhere(CheckLength);
public bool CheckLength(string company)
{
return company.Length > 5 ? true : false;
}
CopyTo(): CopyTo()把集合中的元素复制到一个数组中
eg:
string[] strArray = new string[companyTeams.Count];
companyTeams.CopyTo(strArray);
foreach (string str in strArray)
{
Console.WriteLine(str);
}
ExceptWith():ExceptWith()方法把一个集合作为参数,从集中删除该集合中的所有元素
eg:
companyTeams.ExceptWith(privateTeams);
foreach (var str in companyTeams)
{
Console.WriteLine(str);
}
UnionWith():UnionWith()方法把传送为参数的集合中的所有元素添加到集中
eg:
companyTeams.UnionWith(privateTeams);
foreach (var str in companyTeams)
{
Console.WriteLine(str);
}
HashSet仅返回集的信息、不修改元素的方法。
Contains():如果所传送的元素在集合中,方法Contains()就返回true
eg:
if (companyTeams.Contains(“BMW”))
{
Console.WriteLine(“companyTeams contains “BMW””);
}
IsSubsetOf():如果参数传送的集合是集的一个子集,方法IsSubsetOf()就返回true
eg:
if (traditionalTeams.IsSubsetOf(companyTeams))
{
Console.WriteLine("traditionalTeams is " + “subset of companyTeams”);
}
IsSupersetOf():如果参数传送的集合是集的一个超集,方法IsSupersetOf()就返回true
eg:
if (companyTeams.IsSupersetOf(traditionalTeams))
{
Console.WriteLine("companyTeams is a superset of " + “traditionalTeams”);
}
Overlaps():如果参数传送的集合中至少有一个元素与集中的元素相同,Overlaps()就返回true
eg:
traditionalTeams.Add(“Williams”);
if (privateTeams.Overlaps(traditionalTeams))
{
Console.WriteLine("At least one team is " + "the same with the traditional " + “and privateteams”);
}
SetEquals():如果参数传送的集合和集包含相同的元素,方法SetEquals()就返回true
HashSet是以数学Set集合为基础的,使用HashSet可以提高集合的运算。使用HashSet集合不自带排序方法,如果需要排序的需求可以参考使用List集合配合Sort方法。
HashSet的优势在与运算快,作为一种存放在内存的数据,可以很快的进行设置和取值的操作。HashSet无法向里面添加重复的数据,避免添加HashSet里面的数据重复。我们使用HashSet常常在集合相加集合相减这些集合与集合之间的操作之中。
使用HashSet作为内存存储的快速数据库,这个需要随时跟新HashSet里面的数据,因为在HashSet中一个长时间未被访问的数据,将被系统自动回收掉,那么就会导致失败,那么如何才能保证HashSet里面的值是长存在的而且达到不断的更新里面的值呢?
首先程序过来访问我们HashSet里面有没有需要的数据,如果有我们需要的数据就直接返回给用户,不用调用查询数据库的操作。如果HashSet里面没有我们需要的数据,程序再去查询一次数据库是否有该Query数据,如果有返回给用户同时把查询的结果添加到HashSet里面,这么做可以一定程度的降低查询数据库所带来的不便,但是不能根除,需要进一步提升性能,可以查看前面的缓存策略使用memcached来提高网站查询和访问。
两个集合的并集
HashSet<int> numbers1;
HashSet<int> numbers2;
//分别进行numbers1和numbers2的值初始化或赋值
numbers1.UnionWith(numbers2);//求两个集合的并集。
求两个集合的交集
HashSet<int> numbers1;
HashSet<int> numbers2;
//分别进行numbers1和numbers2的值初始化或赋值
numbers1.IntersectWith(numbers2);//求两个集合的交集。
求两个集合的差集
HashSet<int> numbers1;
HashSet<int> numbers2;
//分别进行numbers1和numbers2的值初始化或赋值
numbers1.ExceptWith(numbers2);//求两个集合的差集。
求两个集合的对称差集
HashSet<int> numbers1;
HashSet<int> numbers2;
//分别进行numbers1和numbers2的值初始化或赋值
numbers1.SymmetricExceptWith(numbers2);//求两个集合的对称差集。
.HashSet常用扩展方法
2.1.Add,将项目添加到HashSet之中。
2.2.Clear,清空HashSet里面的值。
2.3.Remove,从HashSet中移除值。
2.4Contains,判断HashSet是否包含指定项目。
2.4Equals(Object),判断是否相等。
HashSet与Linq操作
HashSet与LINQ的对等的方法
UnionWith ==> Union
IntersectWith ==> Interset
ExceptWith ==> Except
不提供排序 ==> Distinct
那么我们已经有很多的集合类型如List ,Dictionary<TKey,TValue>或Hashtable等这些集合类型,我们该如何选定我应该采用的哪一个集合类型呢?
“如果你必须建立新的设定,或则如果应用程序只需要存取提供的任务,那么使用任何的IEnumerable集合都已经足够了。但是,如果应用程序需要存取其他值,或则不建议不需要建立新的集合,这时可使用HashSet.”