目录

前言

上篇博文中记录了Setup Python环境和Iptyhon,以及Ipython的特性和部分基础功能。现在继续更深入的学习Ipython的特殊功能,以及Ipython的魔力函数—Magic

软件环境
  • 系统
    • Ubuntukylin 14.04
  • 软件
    • Python 2.7.6
    • Ipython 4.0.0
Ipython的字符串处理

Ipython内嵌grep()函数,可以实现类似awk、grep指令的功能
a). 获取要处理的文本内容
IPython基础使用_Round2_存到文件
b). 对文本进行行过滤
contentsInfo.grep(“lineFilter”)
IPython基础使用_Round2_赋值_02
c). 行过滤后再进行的列过滤
contentsInfo.grep(“lineFilter”).fields(rangeArray)
IPython基础使用_Round2_python_03
也可以直接进行列过滤contentsInfo.fields(rangeArray)
IPython基础使用_Round2_历史记录_04
e). 对进行过滤后的Out[ ]作选择操作
IPython基础使用_Round2_python_05

Ipython的魔力函数—Magic

Magic是Ipython内置的丰富的函数库,一般以%开头,支持查看函数的源代码,Magic是Ipython主要内容,为编程提供了很好的便捷性能。其中Magic有两种类型,分别是%:line magic和%%:call magic。前者针对处理一行代码,反之,后者处理多行代码。

%lsmagic — Output所有魔力函数

In [39]: %lsmagic
Out[39]: 
Available line magics:
%alias  %alias_magic  %autocall  %autoindent  %automagic  %bookmark  %cat  %cd  %clear  %colors  %config  %cp  %cpaste  %debug  %dhist  %dirs  %doctest_mode  %ed  %edit  %env  %gui  %hist  %history  %install_default_config  %install_ext  %install_profiles  %killbgscripts  %ldir  %less  %lf  %lk  %ll  %load  %load_ext  %loadpy  %logoff  %logon  %logstart  %logstate  %logstop  %ls  %lsmagic  %lx  %macro  %magic  %man  %matplotlib  %mkdir  %more  %mv  %notebook  %page  %paste  %pastebin  %pdb  %pdef  %pdoc  %pfile  %pinfo  %pinfo2  %popd  %pprint  %precision  %profile  %prun  %psearch  %psource  %pushd  %pwd  %pycat  %pylab  %quickref  %recall  %rehashx  %reload_ext  %rep  %rerun  %reset  %reset_selective  %rm  %rmdir  %run  %save  %sc  %set_env  %store  %sx  %system  %tb  %time  %timeit  %unalias  %unload_ext  %who  %who_ls  %whos  %xdel  %xmode

Available cell magics:
%%!  %%HTML  %%SVG  %%bash  %%capture  %%debug  %%file  %%html  %%javascript  %%latex  %%perl  %%prun  %%pypy  %%python  %%python2  %%python3  %%ruby  %%script  %%sh  %%svg  %%sx  %%system  %%time  %%timeit  %%writefile

Automagic is ON, % prefix IS NOT needed for line magics.

可以看见Ipython拥有丰富的内置函数。下面着重介绍常用的几个。

查看Magic的源码

In [69]: %edit??

??:查看函数、指令、对象的详细信息,包括用法、函数的源代码等
?:查看函数、指令、对象、变量的更加详细使用方法、文档,但不包括函数的源代码

%env 显示系统环境变量

In [40]: %env

%history 查看指令执行历史记录

In [41]: %history -n

%pwd 显示当前目录路径

IpythonShell中的pwd是%pwd的链接,而%pwd是系统Bash中pwd的链接。Ipython中大部分可以直接使用的系统指令都是经过了这样的处理后才能使用。

In [42]: %pwd
Out[42]: u'/usr/local/src/pyScript'

In [43]: pwd
Out[43]: u'/usr/local/src/pyScript'

%pycat 语法高亮显示一个Python程序文件

In [45]: %pycat pyFile.py

%save 将历史指令筛选并保存到文件中

常%save 结合 %history 、%edit 指令一起使用。
%save fileName commandsNnmber
先将历史记录保存到文件中

In [54]: %save testSave 1-3 14-15 24 27-30
File`testSave.py` exists. Overwrite (y/[N])?  y
The following commands were written to file `testSave.py`:
portInfo = get_ipython().getoutput(u'netstat -lpntu')
portInfo
portInfo.grep("tcp")
diskInfo = get_ipython().getoutput(u'df -TH')
diskInfo
diskInfo.grep("ext4",field=1).fields(0)
diskInfo.grep("ext4",field=1).fields(0,3,6)[0]
Out[1]
Out[26]
Out[26][4]

再编辑保存了历史指令的testSave文件,可以非常方便的将调试的指令写入到文件中,再作进一步的处理。

In [56]: %edit testSave.py
    # coding: utf-8
    portInfo = get_ipython().getoutput(u'netstat -lpntu')
    portInfo
    portInfo.grep("tcp")
    diskInfo = get_ipython().getoutput(u'df -TH')
    diskInfo
    diskInfo.grep("ext4",field=1).fields(0)
    diskInfo.grep("ext4",field=1).fields(0,3,6)[0]
    Out[1]
    Out[26]
    Out[26][4]

%run 在IPython执行一个脚本

在IPython中因无法使用python指令来执行一个.py的脚本,所以IPython也内嵌了一个%run函数来代替python command。其中run是%run的链接,所以有下面两种方式,而且还提供能多个选项来满足开发需求。

In [8]: run test.py
My Name is Jmilk!

In [9]: %run test.py
My Name is Jmilk!

a). -t 输出程序执行的CPU timings, -Nx (x为数字)指定程序重复执行的次数。

In [10]: run -t test.py
My Name is Jmilk!

IPython CPU timings (estimated):
  User   :       0.00 s.
  System :       0.00 s.
Wall time:       0.00 s.

In [12]: run -t -N2 test.py
My Name is Jmilk!
My Name is Jmilk!

IPython CPU timings (estimated):
Total runs performed: 2
  Times  :      Total      Per run
  User   :       0.00 s,       0.00 s.
  System :       0.00 s,       0.00 s.
Wall time:       0.00 s.

b). -p 开启Python profiler(Python 程序性能调优)

In [18]: run -t -N2 -p test.py
My Name is Jmilk!

可以显示详细的程序运行时资源使用量的参数。
IPython基础使用_Round2_字符串处理_06
c). -d 进入ipdb控制台中,-bx(x为数字)指定行数打断点。是一个不错的程序调试平台。

In [19]: run -d test.py
Breakpoint 1 at /usr/local/src/pyScript/test.py:1NOTE: Enter 'c' at the ipdb>  prompt to continue execution.
> /usr/local/src/pyScript/test.py(1)<module>()
1---> 1 print "My Name is Jmilk!"

ipdb> 

上述%run函数的几个选项都非常值得深入学习,在以后会继续为大家介绍。

%timeit 测试一条指令执行的时间

%timeit 函数默认会重复执行10000次此条指令,并取出3个最佳的结果来计算平均值,从而得出一条指令执行所需要的时间。

In [23]: %timeit [i*i for i in range(1000)]
The slowest run took 5.67 times longer than the fastest. This could mean that an intermediate result is being cached 
10000 loops, best of 3: 160 µs per loop

a). -n 指定重复执行的次数,默认为10000。-p 显示出详细的高精度时间。

In [31]: %timeit -n 100 [i*i for i in range(1000)]
100 loops, best of 3: 231 µs per loop

In [34]: %timeit -p 1000 [i*i for i in range(1000)]
1000 loops, best of 3: 162.34493255615234375 µs per loop

b). -r 指定取多少个最佳结果来计算平均值,默认为3个。

In [26]: %timeit -p 1000 -r 4 [i*i for i in range(1000)]
10000 loops, best of 4: 162.2743129730224609375 µs per loop

%bookmark 记忆路径

In [36]: %bookmark workspace /usr/local/src/pyScript/

In [39]: cd workspace
(bookmark:workspace) -> /usr/local/src/pyScript/
/usr/local/src/pyScript

注意的是,使用%bookmark的定义的路径无法使用 !cd 来进入。既系统Shell不是别%bookmark定义的变量。

%file 创建并编辑一个文件

In [58]: %%file testFile.py
def myFuncation():
    name = 'Jmilk'
    print "My name is %s" % name
if __name__ == '__main__':
    myFuncation()
   ....: 
Overwriting testFile.py

In [59]: run testFile.py
My name is Jmilk
Python 和 shell 的结合

在Shell中使用Python变量

可以在定义Python变量后,使用$符来结合Shell command和Python variable。需要注意的是,mkdir其实是%mkdir的链接,既本质上是IPython 的内嵌函数%mkdir 可以识别variable “folder” 。

In [62]: folder = 'testVariable'

In [63]: mkdir $folder

In [65]: cd $folder
/usr/local/src/pyScript/testVariable
#反之,指令:!cd $folder 则无法执行

将Shell 的结果赋值给Python vairable。

vairable = !shellCommands

In [83]: import re

In [84]: portInfo = !netstat -lpntu | grep "tcp"

In [86]: portInfo
Out[86]: 
['tcp        0      0 127.0.0.1:11211         0.0.0.0:*               LISTEN      2259/memcached  ',
 'tcp        0      0 127.0.1.1:53            0.0.0.0:*               LISTEN      1468/dnsmasq    ',
 'tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      1761/sshd       ',
 'tcp        0      0 127.0.0.1:631           0.0.0.0:*               LISTEN      5483/cupsd      ',
 'tcp        0      0 0.0.0.0:15672           0.0.0.0:*               LISTEN      2428/beam.smp   ',
 'tcp        0      0 0.0.0.0:55672           0.0.0.0:*               LISTEN      2428/beam.smp   ',
 'tcp        0      0 0.0.0.0:3260            0.0.0.0:*               LISTEN      1823/tgtd       ',
 'tcp        0      0 0.0.0.0:54531           0.0.0.0:*               LISTEN      2428/beam.smp   ',
 'tcp        0      0 0.0.0.0:3306            0.0.0.0:*               LISTEN      1975/mysqld     ',
 'tcp6       0      0 :::80                   :::*                    LISTEN      2845/apache2    ',
 'tcp6       0      0 :::4369                 :::*                    LISTEN      2332/epmd       ',
 'tcp6       0      0 :::22                   :::*                    LISTEN      1761/sshd       ',
 'tcp6       0      0 ::1:631                 :::*                    LISTEN      5483/cupsd      ',
 'tcp6       0      0 :::3260                 :::*                    LISTEN      1823/tgtd       ',
 'tcp6       0      0 :::5672                 :::*                    LISTEN      2428/beam.smp   ']

In [88]: for i in portInfo:
    print re.sub(r"0","J",i)
   ....:     
tcp        J      J 127.J.J.1:11211         J.J.J.J:*               LISTEN      2259/memcached  
tcp        J      J 127.J.1.1:53            J.J.J.J:*               LISTEN      1468/dnsmasq    
tcp        J      J J.J.J.J:22              J.J.J.J:*               LISTEN      1761/sshd       
tcp        J      J 127.J.J.1:631           J.J.J.J:*               LISTEN      5483/cupsd      
tcp        J      J J.J.J.J:15672           J.J.J.J:*               LISTEN      2428/beam.smp   
tcp        J      J J.J.J.J:55672           J.J.J.J:*               LISTEN      2428/beam.smp   
tcp        J      J J.J.J.J:326J            J.J.J.J:*               LISTEN      1823/tgtd       
tcp        J      J J.J.J.J:54531           J.J.J.J:*               LISTEN      2428/beam.smp   
tcp        J      J J.J.J.J:33J6            J.J.J.J:*               LISTEN      1975/mysqld     
tcp6       J      J :::8J                   :::*                    LISTEN      2845/apache2    
tcp6       J      J :::4369                 :::*                    LISTEN      2332/epmd       
tcp6       J      J :::22                   :::*                    LISTEN      1761/sshd       
tcp6       J      J ::1:631                 :::*                    LISTEN      5483/cupsd      
tcp6       J      J :::326J                 :::*                    LISTEN      1823/tgtd       
tcp6       J      J :::5672                 :::*                    LISTEN      2428/beam.smp   

将Shell commands的结果赋值给Pyhon variable后,可以将此List类型的变量再作后期的处理。其中re(regular expression) module在Python中实现正则表达式的功能。re.sub(substitute)则是实现正则表达式的替换功能。

到此IPython的基本介绍也完成了,IPython是一个非常有意思的东西,他所能实现的功能,总会给你惊喜。当然,,这也需要失时间去熟悉他。往后会结合Python的语法和代码实现来继续学习IPython。

Jmilk