浅谈JSON和BSON

JSON (JavaScript Object Notation)JavaScript对象表示法,是一种轻量级的数据交换格式。
JSON 是存储和交换文本信息的语法,类似 XML。比 XML 更小、更快,更易解析。
感觉JSON源于互联网,针对互联网信息的表示、存储,非常方便。并由此产生了BSON,BSON是一种类json的一种二进制形式的存储格式,
简称Binary JSON,它和JSON一样,支持内嵌的文档对象和数组对象,但是BSON有JSON没有的一些数据类型,如Date和BinData类型。
BSON有三个特点:轻量性、可遍历性、高效性。
以上的解释都有些枯燥,更直白地说,用JSON的键值对表示html/JS这些互联网的数据非常方便。比如python中的字典、列表:

bson的使用 java bson和json_json

bson的使用 java bson和json_bson的使用 java_02

1 import json
 2 data_dict = {
 3     'id': 1,
 4     'name': 'Runoob',
 5     'url': 'http://www.runoob.com'
 6 }
 7 data_list = [1,2,3,4,5]
 8 json_str_dict = json.dumps(data_dict)
 9 json_str_list = json.dumps(data_list)
10 print(type(json_str_dict),json_str_dict,repr(json_str_dict))
11 #>>><class 'str'> 
12 {"id": 1, "name": "Runoob", "url": "http://www.runoob.com"} 
13 '{"id": 1, "name": "Runoob", "url": "http://www.runoob.com"}'
14 print(type(json_str_list),json_str_list,repr(json_str_list))
15 #>>><class 'str'> 
16 [1, 2, 3, 4, 5] 
17 '[1, 2, 3, 4, 5]'
通过以上输出来看,python字典数据、列表数据经过json转换后,变为json的str字符串类型。
而json数据再转回python数据也是很方便的:

bson的使用 java bson和json_json

1 python_dict=json.loads(json_str_dict)
 2 python_list=json.loads(json_str_list)
 3 print(type(python_dict),python_dict,repr(python_dict))
 4 #>>><class 'dict'> 
 5 {'id': 1, 'name': 'Runoob', 'url': 'http://www.runoob.com'} 
 6 {'id': 1, 'name': 'Runoob', 'url': 'http://www.runoob.com'}
 7 print(type(python_list),python_list,repr(python_list))
 8 #>>><class 'list'> 
 9 [1, 2, 3, 4, 5] 
10 [1, 2, 3, 4, 5]


不知道是python成就了json,还是json成就了python。感觉二者之间的联系,不能更密切了吧?比如你可以定义一些json格式的文件,为python程序提供输入或者配置。
而python程序的一些输出结果,也可以用JSON文件存储。python读取、写入JSON文件的程序在这里先不进行,其实也很容易。
再谈BSON,后来的MongoDB数据库专门来存储、管理BSON数据。而BSON又是JSON的二进制格式,那么是否可以认为MongoDB就是从文件管理到数据库管理的一个升级?
或者说,当存在大量的JSON文件的时候,如何管理如何查询如何修改,毕竟这方面是文件的一个劣势,而数据库就应运而生呢?
bson_byte_dict=bson.encode(data_dict)
print(type(bson_byte_dict),bson_byte_dict,repr(bson_byte_dict))
#>>><class 'bytes'> 
b'=\x00\x00\x00\x10id\x00\x01\x00\x00\x00\x02name\x00\x07\x00\x00\x00Runoob\x00\x02url\x00\x16\x00\x00\x00http://www.runoob.com\x00\x00' 
b'=\x00\x00\x00\x10id\x00\x01\x00\x00\x00\x02name\x00\x07\x00\x00\x00Runoob\x00\x02url\x00\x16\x00\x00\x00http://www.runoob.com\x00\x00'
从上面可以看出,bson通过encode函数处理python的dict数据,变为二进制bytes类型。而且,也很容易再转换回来:
python_dict = bson.decode(bson_byte_dict)
print(type(python_dict), python_dict, repr(python_dict))
#>>><class 'dict'> 
{'id': 1, 'name': 'Runoob', 'url': 'http://www.runoob.com'} 
{'id': 1, 'name': 'Runoob', 'url': 'http://www.runoob.com'}
总结上述,JSON、BSON、MongoDB相比于之前的传统关系型数据库,在存储互联网数据方面有很大的优势。而且对于大数据分布式平台来说,Nosql的数据库更方便做分布式处理。当然也
可以不用python语言作为中间的纽带,java一定也可以。