python的强大之处就在于有许多已经写好的功能库提供,这些库强大且易用,对于写一些有特定功能的小程序十分方便。

现在就用pyhton的selenium+谷歌游览器写一个可以自动刷课的程序,以智慧树上的网课为例。

原理说明:selenium 是一套完整的web应用程序测试系统,可以模拟真实游览器,支持多种游览器。简单来说就是可以定位到html元素,比如按钮,输入框之类的,然后模拟点击,模拟输入等从而实现自动化效果。selenium难点在于定位元素。


 

一 .开始之前准备

1.安装selenium:在cmd窗口输入:pip isntaller selenium

2.下载谷歌游览器的驱动chromedriver:https://pan.baidu.com/s/1_wopkNwvmKvqLlNxY_EagQ  (7yxk)

3.安装一个谷歌游览器,最好是最新版的

二.分析网站

要定位元素就要分析网站的一些元素的源代码是如何写的。

1.智慧树的登陆页面

python 脚本自动刷网课 python刷网课代码_Python刷网课

python 脚本自动刷网课 python刷网课代码_python_02

2.用谷歌游览器的审查元素功能查看元素的源代码

按右键选择审查或按F12,得到如下的页面

python 脚本自动刷网课 python刷网课代码_Python刷网课_03

可以看到输入手机号那一个输入框有一个id选择器,这样就可以根据id选择器的名字定位到这个元素。

其它元素也可以用同样的方法定位元素,然后根据具体情况选择不同的定位方式。

 

python 脚本自动刷网课 python刷网课代码_选择器_04

 

3.写代码

1 from selenium import webdriver
  2 
  3 import time
  4 import threading
  5 
  6 browser=webdriver.Chrome()
  7 #请求登陆页面
  8 browser.get('https://passport.zhihuishu.com/login?service=http://online.zhihuishu.com/onlineSchool/')
  9 
 10 #登陆
 11 def login(number,password):
 12     phone_number=browser.find_element_by_id('lUsername')#通过id定位,手机号码
 13     pwd=browser.find_element_by_id('lPassword')#密码
 14     login_btn=browser.find_element_by_class_name('wall-sub-btn')#登陆按钮
 15 
 16     phone_number.send_keys(number)#输入手机号码
 17     pwd.send_keys(password)#输入密码
 18     login_btn.click()#点击登陆按钮
 19 
 20 #转到播放视频页面
 21 def to_course(key):
 22 
 23     time.sleep(5)
 24     current=browser.current_window_handle#当前页面的句柄
 25     key=browser.find_element_by_partial_link_text(key)#找到课程
 26     key.click()#跳转到播放视频页面
 27     time.sleep(1)#等待页面加载
 28     #因为跳转到新的页面,所以browser要切换到新的页面操作
 29     handles=browser.window_handles
 30     for handle in handles:
 31         if handle!=current:
 32             browser.switch_to.window(handle)
 33     
 34     time.sleep(10)
 35     try:
 36         video=browser.find_element_by_id('mediaplayer')#定位视频窗口
 37         video.click()#点击播放
 38     except:
 39         pass
 40   
 41 
 42 
 43 #判断是否有答题窗口弹出
 44 def is_exist():
 45     while True:
 46         try:
 47             browser.switch_to.default_content()
 48             browser.switch_to.frame('tmDialog_iframe')#答题窗口在另一个frame里面,要切换
 49             box=browser.find_elements_by_class_name('answerOption')#答题列表
 50             radio=box[0].find_element_by_tag_name('input')#找到第一个选项
 51             radio.click()#选择
 52             browser.switch_to.default_content()
 53             browser.find_element_by_link_text('关闭').click()#关闭答题窗口
 54         except:
 55             browser.switch_to.parent_frame()#没有弹出,切换回本来的frame
 56         time.sleep(5)
 57 
 58 #判断当前视频是否结束
 59 def is_end():
 60     while True:
 61         try:
 62             video=browser.find_element_by_id('mediaplayer')#定位视频窗口
 63             #获取当前播放的进度
 64             current_time=video.find_element_by_class_name('currentTime').get_attribute('textContent')
 65             #该视频的总时间
 66             total_time=video.find_element_by_class_name('duration').get_attribute('textContent')
 67             print(current_time,total_time)
 68             if current_time==total_time:
 69                 #当前视频播放结束,点击下一节
 70                 js="document.ElementById('nextBtn').click()"#js脚本
 71                 browser.execute_script(js)
 72                 
 73             time.sleep(10)#10秒检测一次
 74         except:
 75             current_time='00:00'
 76             total_time='00:01'
 77       
 78             
 79         
 80 if __name__=='__main__':
 81     
 82     '''
 83     number=''#手机号码
 84     password=''#密码
 85     key=''#课程名称,可以部分名字
 86           
 87     '''
 88     login(number,password)
 89     to_course(key)
 90     #开两个线程
 91     t1=threading.Thread(target=is_exist)
 92     t2=threading.Thread(target=is_end)
 93     t2.start()
 94     time.sleep(3)
 95     t1.start()
 96     t2.join()
 97     t1.join()
 98 
 99 
100 
101

 登陆过程:

python 脚本自动刷网课 python刷网课代码_选择器_05

 

-------------

这个程序只是做一个简单的演示,并没有做到很全面,但也可以用的。

 

selenium定位不到元素时会报错,要处理好,否则程序就没用了。元素定位最好使用WebDriverWait的方式,加上异常控制。

网站是会变化的,分析好网站操作基本的过程,基本没有问题了。

selenium定位不到元素有以下几种情况

1.通过class定位时,有时定位不到

2.页面没有加载出来,元素无法定位

3.元素不可见,无法定位

4.元素被其它元素遮挡了

5.方法用错了