记录抽取:对数据进行抽取
记录抽取数据公式:dataframe[condition]
condition 过滤的条件
返回值: dataframe
条件类型:
01 比较运算 <>=
02 范围运算 between[left,right]
df[df.comments.between(100,1000)]
03 控制匹配 pandas.isnull(column)
例如:df[pandas.isnull(df.title)]
常见类型
1 字符匹配:
str.contains(patten,na=false)
例如:df[df.title.str.contains('电台',na=false)]
2 逻辑运算
与(&),或(|)取反(not)
例如:df[(df.comments>=1000)&(df.comments<=10000)]
01 单条件
df[df.comments>10000]
02 多条件
df[df.comments.between(1000,10000)]
03 过滤空值所在行
import pandas
df[pandas.isnull(df.title)]
04 根据关键词替换 ~取反的意思,na代表空值,不需要进行匹配过滤
df[~df.title.str.contains('台电',na=False)]
05 组合逻辑
df[(df.comments>1000)&(df.comments<10000)]