问卷星java请求 问卷星selenium_python


不知道你家单位是怎么让各位职工上报自己体温的,总之我现在好像一天要报3次这样的感觉,比如这个东西,一天要填1次。每次填报的内容都是一样样的(除了体温以外),但是不能不填,填错了还不好办,怎么办呢?能不能就比较简单的运行一个代码就搞定呢?


路人乙小明:genecards是个好东西,但是如果要能用python访问的话就更好了zhuanlan.zhihu.com

问卷星java请求 问卷星selenium_输入框_02


之前这篇里面试用了一下selenium,当时拿到page_source以后剩下的事情就全交给beautiful soup了。这一次不是简单的获取页面数据,而是要往上面填东西,所以要更多的依靠selenium。selenium本身不是python的库,但是有python的接口,而python接口的文档在这里。

如何用webdriver打开chrome,如何载入页面这里就不赘述了,最后反正会给出github repo的。这篇文章对应的代码是health_report.py,chrome载入的option写在了selenium_setting.py里面。和个人有关的一些信息写在了personal_info.yaml里面,这个yaml没有传上repo,自己写一个倒也简单


name: xxxx
fosu_id: xxxx


目前就先只涉及了这两个个人信息而已。health_report.py, selenium_setting.pypersonal_info.yaml都放在同一个文件夹中。

具体到这个报平安的表,如果做一下分析可以看出来有4种问题:

  1. 最简单的,文本填空题

这种很容易做,就使用selenium的send_keys就能搞定


def text_question_fill(question_id,text2input):
    question_ele = driver.find_element_by_id(question_id)
    question_ele.clear()
    question_ele.send_keys(text2input)


其中question_id就是题目的id,比如第一题填写姓名,右键点输入框然后选检查,就能看到对应的input元素的id是q1,这个作为函数的第一个参数,自己的姓名作为第二个参数,这个调用就完成了

2. 稍微麻烦一点的,选项题

这种题目的html一般是下面这样的:


<select name="q5" id="q5">
  <option value="-2">请选择</option>
  <option value="18">修复种植科</option>
  <option value="4">医务科</option>
  ...
</select>


对于这种组件,当然首先你要弄清楚你要选的那个项目它的value是什么,比如你是修复种植的,那你就找value=18这一项。然后,你需要selenium的Select support。在导入了Select这个类以后,先要实例化,实例化的时候将q5这个问题对应的元素作为参数传入,然后你就做了一个Select的实例,然后对这个实例使用方法select_by_value就能选择选项了


selector_q3 = Select(driver.find_element_by_id('q3'))
selector_q3.select_by_value('7')


2020-4-16 更新

最近问卷星更新了一下,原来的select标签停用了,改用了div组的形式,用jquery动态更新页面,总之就很噩梦就是了。对于这类情况,selenium有一个Actionchains类可以协助解决。比如对于第三题,虽然现在没法使用select support直接选value=3的项目,但是我可以移动到第三题,点击第三题,按三次方向键下,然后再按回车呀,结果是一样的呀~~


action_1 = ActionChains(driver)
ele_q3 = driver.find_element_by_id('select2-q3-container')
action_1.move_to_element(ele_q3)
action_1.click(ele_q3)
action_1.key_down(Keys.DOWN)
action_1.key_down(Keys.DOWN)
action_1.key_down(Keys.DOWN)
action_1.key_down(Keys.ENTER)
action_1.perform()


超简单粗暴……才怪啊!!!!

我发现问卷星这个选项的排序tm居然不是固定的,不是固定的!!!!!!!!

好吧,这样一来我们就需要按一次下,再按一次回车,然后让selenium看一下我们选对了没有

所以把上面的代码做成一个函数,然后递归调用:


def select_actionchain(element,select_val:str):
    action = ActionChains(driver)
    action.move_to_element(element)
    action.click(element)
    action.key_down(Keys.DOWN)
    action.key_down(Keys.ENTER)
    action.perform()
    if element.text==select_val:
        pass
    else:
        select_actionchain(element,select_val)

ele = driver.find_element_by_id('select2-q3-container')
select_actionchain(ele,'行政后勤')

ele2 = driver.find_element_by_id('select2-q5-container')
select_actionchain(ele2,'科研科')


来呀,来快活呀,让我看看你还能搞出什么幺蛾子,来呀!!!

3. 还要复杂一些的,日期选择题


问卷星java请求 问卷星selenium_输入框_03


点输入框以后会弹出这个日期选择框,然后点“今天”就可以完成这道题的操作。关键是怎么教电脑去做这个事情。原本我觉得先给日期输入框发送一个click,然后再等个半秒总该弹出来日期选择框了,之后再给今天这个按钮发送click就好了。两个元素都能依靠id找到,所以并不难,才对。

不过这里有个问题,日期选择框是包在iframe里面的。iframe相当于另外一套网页,从主网页这里是搜不到里面的内容的。所以要用到selenium的switch_to


q4 = driver.find_element_by_id('q4')
q4.click()
time.sleep(1)

#frame switch
driver.switch_to.frame(driver.find_element_by_id('div__calendarIframe'))
#click today
driver.find_element_by_id('selectTodayButton').click()
driver.switch_to.default_content()


4. 第四种,最麻烦的,没有id可以找


问卷星java请求 问卷星selenium_输入框_04


比如我是想选择第一项,无,但是看一下html的代码就知道会比较麻烦:


<div class="ui-checkbox">
  <span class="jqcheckwrapper">
    <input type="checkbox" value="1" id="q7_1" name="q7" style="display:none;">
    <a class="jqcheck" href="javascript:;"></a>
  </span>
  <div class="label" for="q7_1">无</div>
</div>


这是一个选项所对应的html代码,我们需要点击的是那个<a>元素,这东西不大好找,照理说可以用xpath或者css selector写出来,但是我用的是另外一种方式:


def click_one_div(question_div_id:str, click_index:int, content_should_be='无'):
    check_boxes = driver.find_element_by_id(question_div_id).find_elements_by_class_name('ui-checkbox')
    click_one = check_boxes[click_index]
    print(click_one.find_element_by_class_name('label'))
    assert click_one.find_element_by_class_name('label').text == content_should_be, f"提供的click_index:{click_index}不正确"
    click_one.find_element_by_class_name('jqcheck').click()


这个函数第一个参数是问题的id,和其他的问题一样,这种多选题也是有id的。第二个参数是需要点击的选项的次序。比如说我要点第一个,次序就是0,第二个,次序就是1,最后一个次序就是-1,就是按照python list写index的方式写就是了。然后第三个参数是用来做校验的,将选项文本和校验文本比对,费事点错了。

就是这样,四种问题,四种应对方式,repo地址在下面:

beneon/selenium_little_scriptgithub.com

祝君,身体健康