昨天学的导入HTML数据来记录一下,虽说暂时看不懂,但是却在CSDN找到更简单的导入方式,其实刚接触会发现很多代码啊,报错也是看不懂。但是我相信继续深入会慢慢越来越好的额。
代码如下:实现导入NBA球员薪资的导入在pycharm
import pandas as pd
df=pd.DataFrame()
url_list=['http://www.espn.com/nba/salaries/_/seasontype/4']
for i in range(2,13):
url='http://www.espn.com/nba/salaries/_/page/%s/seasontype/4'%i
url_list.append(url)
#遍历网页中的table标签读取网页表格数据
for url in url_list:
df=df.append(pd.read_html(url),ignore_index=True)
#列表解析:遍历dataframe对象的第3列,以字符串$开头
df=df[[x.startswith('$')for x in df[3]]]
print(df)
df.to_csv(r'D:\Pycode\NBA.csv',header=['RK','NAME','TEAM','SALARY'],index=False)
#导出csv文件
效果展示:
然后我说下我在百度上找到的,同样是CSDN大神写的代码,主要实现的功能是导入虎扑网站的积分排行榜:
下面直接上代码
import pandas as pd
url = "https://nba.hupu.com/standings"
res = pd.read_html(url)
print(res)
展示效果:
虽说如果说去读取其他的网页后就报错了,但是还是感觉非常神奇了,希望后面能的学习能学到跟更多东西
最后喜欢学Python的朋友可以给我点个收藏点个赞哦!,谢谢了!