一、计算机运行基本原理及python基础

在了解计算机运行基本原理之上,理解python程序运行基本原理。做好数据分析准备工作。

安装好Anaconda做好相应变量配置,下载cmd工具Conemu,利用Anaconda工具安装配置好jupyternotebook。

二、jupyternotebook上的代码示例

打开conemu,输入命令 conda env list 查看所创建的虚拟环境,选择第二个虚拟环境,打开jupyternotebook进行代码练习。

打开jupyternotebook如下图:

建立了以python3为基础的代码练习,点击左上角的File可以对文件进行保存,输出为各种格式。按Run为运行(或者ctrl+Enter)命令,code为代码输出。

三、python脚本常用结构

四、代码练习实例

#!/usr/bin/env python
# coding: utf-8
# In[1]:
print("hello world")
# In[2]:
name = 'python3:猴子数据分析社群'
# In[3]:
name
# # 如何盖房子
#
# ## 第1步 房子设计
#
# ## 第2步 地基(数据分析运行环境)
#
# ## 第3步 准备材料(数据)
#
# ## 第4步 组合材料(函数,条件判断,循环)
# In[4]:
nameStr = '马云'
nameStr2 = '有钱'
print(nameStr + nameStr2)
# In[66]:
str1 = '我叫%s ,俺爹是 %s' % ('王思聪','王健林')
print(str1)
# In[ ]:
# In[11]:
age = 50
# In[13]:
money = 3.53
# In[16]:
namelist = ['猴子','马云','王健林','马化腾']
namelist
# In[19]:
namelen = len(namelist)
print('列表长度:病人数目:',namelen)
# In[23]:
namelist.append('刘强东')
print('增加一个元素:',namelist)
# In[24]:
del namelist[1]
print(namelist)
# In[26]:
name1 = namelist[0]
print (name1)
# In[27]:
print(namelist[0])
namelist[0] = '孙悟空'
print(namelist[0])
# In[29]:
gafataTuple = ('腾讯','阿里巴巴','苹果','谷歌','Facebook','亚马逊')
gafatalen=len(gafataTuple)
print(gafatalen)
print(gafataTuple[0])
# In[30]:
gafatasets= {'腾讯','阿里巴巴','苹果','谷歌','Facebook','亚马逊','亚马逊'} # 容器,集合(sets)是一个没有重复元素的容器
print(gafatasets)
# In[32]:
stocksets = set()
stocksets.update(['腾讯','阿里巴巴','京东'])
print(stocksets)
# In[34]:
stocksets.discard('京东')
print(stocksets)
# In[35]:
txBOOL = '腾讯' in stocksets
print(txBOOL)
# In[36]:
stocksets.discard('京东')
stocksets.update(['京东'])
print(stocksets)
# In[15]:
patientDic2 ={'001':['猴子',29,'1型糖尿病','较差'],
'002':['马云',34,'2型糖尿病','好转'],
'003':['王健林',28,'1型糖尿病','显著好转'],
'004':['马化腾',52,'2型糖尿病','较差'] }
print(patientDic2)
# In[16]:
valueList1 = patientDic2['001']
print(valueList1)
# In[17]:
print('修改之前,病人信息:',patientDic2['001'])
patientDic2['001']=['猴子',29,'1型糖尿病','好转']
print('修改之后,病人信息:',patientDic2['001'])
# # 条件判断
# In[20]:
# 《摔跤吧,爸爸》豆瓣评分
scoreNum =9.1
if scoreNum >=8:
print('我要去看这部电影')
else:
print('电影太烂,不去看了')
# 我要去看这部电影
##条件判断的一般格式
# if 边界条件:
#缩进 要做的事情1
# eles:
#缩进 要做的事情2
# # 条件判断:边界条件
#
# ## 1、值比较 大于 小于 大于等于 小于等于 不等于 等于
# ## 2、逻辑比较 并且 或者 不是
# In[22]:
#定义列表:病人姓名
nameList = ['猴子','马云','王健林','马化腾']
if '猴子' not in nameList:
print('列表中没有叫猴子的病人')
else:
print('列表中有个叫猴子的人')
# # 多个条件判断
#
# ## if # 边界条件1:
#
# ## 缩进 要做的事情1
#
# ## elif 边界条件2:
#
# ## 缩进 要做的事情2
#
# ## else:
#
# ## 缩进 要做的事情3
#
# In[33]:
age=int(input('请输入你家狗狗的年龄,按enter键获取计算结果:'))
if age< 0:
print('狗狗年龄不能小于0')
elif age == 1:
print('相当于14岁的人')
elif age == 2:
print('相当于22岁的人')
else:
human = 22+(age-2)*4
print ('对应人类年龄:',human)
# # 循环批量处理数据
# ##for i in 容器:
# ##要做的事情
# In[31]:
# 重复性工作
print('吃第1次饭')
print('吃第2次饭')
print('吃第3次饭')
# 容器:1天中吃第几次饭
eatList= ['吃第1次饭','吃第2次饭','吃第3次饭']
#循环
for i in eatList:
print(i)
# In[43]:
'''

定义字典:6家公司(GAFATA)的股票

key是公司名称,value是股票代码

'''

gafataDict = {'腾讯':'HK:00700','阿里巴巴':'baba','苹果':'Apple',

'谷歌':':GOOGLE','Facebook':'fb','亚马逊':'amzn'}

#将股票代码全部大写
for key,value in gafataDict.items():
# 将股票代码转换成大写
newValue = value.upper()
#将转换后的新股票代码直接赋值给对应的key
gafataDict[key]=newValue
print(gafataDict)
# In[52]:
for key,value in gafataDict.items():
if (key== '苹果'):
continue
print('当前公司:',key,'当前股票代码:',value)
# In[56]:
number = 0
for key,value in gafataDict.items():
number = number + 1
if(key =='苹果'):
print('查找',key,'公司的股票代码是',value)
break
print('当前公司:',key,',当前股票代码:',value)
# In[61]:
'''

定义函数

函数功能:两个数相加

输入:x ,y是要相加的两个数

输出:两个数相加的和

'''
# In[2]:
#定义函:改变例表的值
def changeList(inputList):
inputList.append('奶茶妹妹')
'''

使用函数

参数是可变数据类型:

传递的是该变量的引用地址

'''
nameList = ['马云','刘强东']
print('调用函数之前的值:',nameList)
changeList(inputList= nameList)
print('调用函数之后的值:',nameList)
# In[4]:
#变量作用域
def test():
aStr= '别理会他人闲言碎语,今日随他们,让他们说吧,你的机会将会到来,再来证明自己。'
# 在函数外面,访问函数内的局部变量aStr
print(aStr)
# # 如何使用python内置模块
# In[5]:
'''
python内置模块
'''
# 第1步:引入模块
import sys
#第2步:使用模块中的函数,属性
pathList = sys.path
print ('python 路径为:\n',pathList)
# In[18]:
import pandas as pd
fileNameStr=r"C:\Users\tomgs\Desktop\病历数据.xlsx"
xl = pd.ExcelFile(fileNameStr)
patientDf = xl.parse('Sheet1')
print(patientDf)
# # 数据结构 集合
# ## 双向链表 queue
# ## 排序字典 OrderedDict
# ## 计数器 Counter
# In[13]:
# 定义队列:排队吃
from collections import deque
queue=deque(['001','002','003','04','005'])
queue.append('006')
print(queue)
# In[15]:
# 定义栈:浏览我个人知乎主页的顺序
stack = deque(['知乎动态','知乎回答','知乎文章'])
#入栈:在栈顶加入元素
stack.appendleft('知乎专栏')
print (stack)
# In[16]:
stack.pop()
print(stack)
# # python默认的字典
# In[20]:
#6家公司名称及股票代码
gafataDict = {'腾讯':'HK:00700','阿里巴巴':'baba','苹果':'Apple',
'谷歌':':GOOGLE','Facebook':'fb','亚马逊':'amzn'}
# In[22]:
gafataDict
# # collention 中排序字典
# In[23]:
'''
0rderedDict:按照插入Key的顺序,对字典排序
'''
from collections import OrderedDict#定义有序字典
gafataOdDict=OrderedDict({'腾讯':'HK:00700','阿里巴巴':'baba','苹果':'Apple',

'谷歌':':GOOGLE','Facebook':'fb','亚马逊':'amz

五、代码练习中的感受

1、python学习过程中要多敲代码,多练习才能对各种基本的规则了解,熟悉。

2、要善于使用工具,方便学习。我这里主要安装了能够简化代码的变量。安装了一个有道词典的小工具,当错误提示出来的时候,可以通过实时翻译查找错误原因。