本文主要内容:
1.简要介绍mongodb
2.Pymongo
3.mongo shell
4.我的mongodb入门之旅
1.简要介绍mongodb
MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,是类似json的bjson格式,因此可以存储比较复杂的数据类型。Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。园里有博友的介绍写的比较详细,还介绍了mongo的安装
2.Pymongo
在说pymongo之前,先看看一篇博文,特别适合有数据库操作经验的看:
PyMongo 是 MongoDB 的 Python 接口开发包。
3.mongo shell
学mongo非常有必要学mongo shell
因为mongo shell 可以更加便捷的直接操作数据库,特别适合检查。
这个shell和Mongodb里的很多操作都有相似之处,不要孤立起来学
4.我的mongodb入门之旅
以上这些信息,我们不可能一开始就掌握,稍微有个大致的了解就行。
OK,下面开始我的mongo入门之旅了,这才是今天的重点
4.1 使用 mongo -port XXXX 登录shell (由于服务器中的mongo端口已经更改了)
4.2 use test_for_new (建立一个新的数据库,我在shell里没找到建立的命令,试了下这个use命令,这个也能间接建立数据库)
4.3 show dbs 显示系统的数据库名称 和对应大小
show collections 显示当前使用的数据库中的collections(应该是集合的意思),这个collection对应于关系数据库中表。show tables 有同样效果
db 查看当前使用数据库的名称
4.4 同样没找到建立collections的现成命令,实验后发现。这个数据库的使用就和python里的变量一样不需事先申明。
直接用就行了,没有的话会自动建立。可以用dbs.collections的形式(像面向对象吧),例如:
db.collection1.insert({a:1,b:1}) 怎一个爽字了得,这个{}可以理解成python里的dict。还有如果嫌命令太长,可以事先将
coll=db.collection1 (赋值给一个临时变量) coll.insert({a:1,b:1}) 这插入格式为什么是这样,先放放 咱不急。
使用coll.find()就可以看到collection1的所有数据了,使用coll.drop()就可以删除该collection及里面的数据了。那么多插一些数据到collection1吧
4.5 关于插入,必须要注意几点。其一,因为是非关系的,所以不会严格限制格式,底层的存储像dict 所以可以 coll.insert({a:1,b:1,c:1})
其二,即便你再coll.insert({a:1,b:1})一下,他也不会报错,而且出来的是两条该数据,不信的话用coll.find({a:1,b:1})试试
事实上系统会增加一个唯一标识字段“_id”用于区分数据
这点和versant数据库到很像,有点面向对象的味道
4.6 删除a=1,b=1的数据
coll.remove({a:1,b:1}) 注意了 删的是俩条数据哦
4.7 将b=1的所有数据的a改成1
coll.update({b:1},{$set:{a:1}})
4.8 OK,增删改查都有了 shell差不多就介绍这么多了。下面要用pymongo
关于pymongo的介绍,我想没必要再这样一步一步来了,否则就有污蔑大众智商的嫌疑了。直接给代码吧,我尽量多写些有意义的注释。
1 #! /usr/bin/env python
2 # -*- coding: utf-8 -*-
3 import pymongo
4
5 class PyConnect(object):
6
7 def __init__(self, host, port):
8 #conn 类型<class 'pymongo.connection.Connection'>
9 try:
10 self.conn = pymongo.Connection(host, port)
11 except Error:
12 print 'connect to %s:%s fail' %(host, port)
13 exit(0)
14
15 def __del__(self):
16 self.conn.close()
17
18 def use(self, dbname):
19 # 这种[]获取方式同样适用于shell,下面的collection也一样
20 #db 类型<class 'pymongo.database.Database'>
21 self.db = self.conn[dbname]
22
23 def setCollection(self, collection):
24 if not self.db:
25 print 'don\'t assign database'
26 exit(0)
27 else:
28 self.coll = self.db[collection]
29
30 def find(self, query = {}):
31 #注意这里query是dict类型
32 if type(query) is not dict:
33 print 'the type of query isn\'t dict'
34 exit(0)
35 try:
36 #result类型<class 'pymongo.cursor.Cursor'>
37 if not self.coll:
38 print 'don\'t assign collection'
39 else:
40 result = self.coll.find(query)
41 except NameError:
42 print 'some fields name are wrong in ',query
43 exit(0)
44 return result
45
46 def insert(self, data):
47 if type(data) is not dict:
48 print 'the type of insert data isn\'t dict'
49 exit(0)
50 #insert会返回新插入数据的_id
51 self.coll.insert(data)
52
53 def remove(self, data):
54 if type(data) is not dict:
55 print 'the type of remove data isn\'t dict'
56 exit(0)
57 #remove无返回值
58 self.coll.remove(data)
59
60 def update(self, data, setdata):
61 if type(data) is not dict or type(setdata) is not dict:
62 print 'the type of update and data isn\'t dict'
63 exit(0)
64 #update无返回值
65 self.coll.update(data,{'$set':setdata})
66
67 if __name__ == '__main__':
68 connect = PyConnect('localhost', 27017)
69 connect.use('test_for_new')
70 connect.setCollection('collection1')
71 connect.insert({'a':10, 'b':1})
72 result = connect.find()
73 connect.update({'a':10, 'b':1}, {'b':10})
74 #x也是dict类型,非常好
75 for x in result:
76 if 'c' in x:
77 print x['_id'], x['a'], x['b'], x['c']
78 else:
79 print x['_id'], x['a'], x['b']
80 connect.remove({'a':10})
4.9 补充:在调用self.conn[dbname]和self.db[collection].find(query)的时候要是能再加个存在性判断就好了,不然很容易出问题。
5.0 好了,本文到这里就结束了,最后留个问题。在以上代码中最终输出结果里为什么是a=10,b=10,而不是a=10,b=1