SQLServer简介
以下摘自百度百科:
SQL Server是由Microsoft开发和推广的关系数据库管理系统(DBMS),它最初是由Microsoft、Sybase和Ashton-Tate三家公司共同开发的,并于1988年推出了第一个OS/2版本。Microsoft SQL Server近年来不断更新版本,1996年,Microsoft 推出了SQL Server 6.5版本;1998年,SQL Server 7.0版本和用户见面;SQL Server 2000是Microsoft公司于2000年推出,目前最新版本是2019年份推出的SQL SERVER 2019。
SQL Server是微软推出的重量级的数据库,目前有多个版本,如2000、2008、2012等,这些版本名字均为该版本推出的年份,每个版本的差异并不是特别大。本文使用SQL Server2016。
解决方案:
1、根据当前的 python版本下载pymssql模块,地址https://www.lfd.uci.edu/~gohlke/pythonlibs/#pymssql
例如我的是python3.6-64位的就找这个版本对应的sqlserver
下载到本地后,在本地的路径CMD打开窗口,输入pip install 文件名称即可
安装pymssql
python内未集成SQLServer的操作库,需要安装pymssql库。
pip3 install pymssql
安装完成后使用import pymssql导入。
增删改查(CRUD)
数据库远程访问配置
使用pymssql访问SQLServer,需要启用SQLServer的TCP/IP协议。
如下图所示,打开SQLServer配置管理器,选择“SQL Server网络配置”中对应的需要使用的实例,在右侧窗口中启用TCP/IP协议。
接着重启SQL Server服务,就可以通过IP的形式访问数据库了。
数据库中,中文内容需要使用nvarchar类型,否则,不能读取。
插入操作
import pymssql
db = pymssql.connect(host=".",database="wangTest", autocommit=True,charset="utf8")
if db:
print("连接成功")
else:
print("fail")
exit()
"""
#插入单个记录
sql = "INSERT INTO student(sname,sage) VALUES ('%s',%d)" %('王平',22)
# 创建一个游标对象
cursor = db.cursor()
cursor.execute(sql)
"""
#一次插入多个记录 %s不要加引号
sql = "INSERT INTO student(sname,sage)VALUES (%s, %d)"
data= [('王小明',21),('张梅梅',20)]
cursor = db.cursor()
cursor.executemany(sql,data)
db.commit()
print("Data Successfully Inserted")
cursor.close()
db.close()
查询操作
import pymssql
db = pymssql.connect(host=".",database="wangTest", autocommit=True,charset="utf8")
if db:
print("连接成功")
else:
print("fail")
exit()
#条件查询
#数字直接相连
#sql = "SELECT * FROM student where rowid=%d"%(4)
#字符加引号
#sql = "SELECT * FROM student where sname='%s'"%("王平")
#模糊查询,以王开头,后继任意个字符
sql = "SELECT * FROM student where sname like '%s%%'"%("王")
#sql = "SELECT * FROM student "
# 创建一个游标对象
cursor = db.cursor()
# 查看现有表
cursor.execute(sql)
dataset=cursor.fetchall()
print(dataset)
cursor.close()
db.close()
读入pandas
import pymssql
import pandas as pd
db = pymssql.connect(host=".",database="wangTest", autocommit=True,charset="utf8")
if db:
print("连接成功")
else:
print("fail")
exit()
#条件查询
#数字直接相连
#sql = "SELECT * FROM student where rowid=%d"%(4)
#字符加引号
#sql = "SELECT * FROM student where sname='%s'"%("王平")
#模糊查询,以王开头,后继任意个字符
#sql = "SELECT * FROM student where sname like '%s%%'"%("王")
sql = "SELECT * FROM student "
df=pd.read_sql(sql, db)
print(df)
db.close()
直接写excel可能会报内存错误,因此,全部转为csv文件。
import pymssql
import pandas as pd
db = pymssql.connect(host=".",database="sichuan_flash0525", autocommit=True,charset="utf8")
if db:
print("连接成功")
else:
print("fail")
exit()
#条件查询
#数字直接相连
#sql = "SELECT * FROM student where rowid=%d"%(4)
#字符加引号
#sql = "SELECT * FROM student where sname='%s'"%("王平")
#模糊查询,以王开头,后继任意个字符
#sql = "SELECT * FROM student where sname like '%s%%'"%("王")
#每年一个文件,每一个月一个表单
year=2013
month=1
for year in range(2013,2024):
for month in range(1,13):
sql = "SELECT [时间] ,[微秒] ,[纬度],[经度],[电流],[回击],[主机号],[定位站数],[定位站],[定位站值] FROM [flash] "
#组合按月查询条件
if(month<=11):
condition=" where [时间] between '%d-%02d-01 00:00:00' and '%d-%02d-01 00:00:00'"%(year,month,year,month+1)
else:#12月单独处理,介于本年的12月1日到下一年的1月1日之间
condition=" where [时间] between '%d-%02d-01 00:00:00' and '%d-%02d-01 00:00:00'"%(year,month,year+1,1)
#按月查询
sql=sql +condition
df=pd.read_sql(sql, db)
#数量为0就不保存
if df.shape[0]<=0:
continue
print(year,"-",month,"=",df.shape[0])
#每月一个文件,文件名:年月_数据量.csv,gb2312可以正确显示中文标题
sheetName="M%d%02d_%d.csv"%(year,month,df.shape[0])
df.to_csv("data//"+sheetName,encoding="gb2312")
db.close()
print("gameOver")