前几日工作中模拟用户操作,遇到了滑块验证,虽然难度一般,但是还是做一下记录吧。只留下关于获取滑块移动距离的计算过程,其他相关,已有很多,随便都可以搜到。
先说下思路:(通过selenium获取界面并获取标签内容或者样式就跳过)
第一步就是要获取滑块的高度,因为发现,滑块的left永远都是不变的,不过我没有观察很多网站,不晓得是不是所有的都是这样,如果不是可以提前取出left值,为后边计算移动距离做准备。
第二步,获取滑块图片。通过灰化,然后取滑块4个边的RGB像素值总和作比较,因为图片经过灰化处理,所以有缺口或者突出的一边,值有明显区别。我选择的是左边作为标准,所以如果左边是缺口或者突出的,我选择刷新。如果满足左边为正常边,进行下一步。
第三步,将大图中,滑块对应的位置,从左到右应该是一长条,将这一长条用像素分为n列,取每一列的RGB像素和,相邻的两列作比较,有缺口位置的那一列和前一列差值很大,我测试的时候,差值在10000+以上,所以以此可以获取缺口位置,我是通过列表索引获取该位置横轴坐标。
第四步,通过滑块位置和缺口位置的差值计算,就可以得到,滑块所需要移动的距离值。剩下的就是需要模拟人的行为对滑块进行移动,防止被拦截。
12.11:通过在滑块接近缺口时减速、超出缺口再返回、松开滑块前加延时,可以增加成功率。
2020/7/24:附上移动参数的处理,模拟移动的代码
# 对滑块的判断,并取出滑块的top
def get_slide_block(self, driver):
while True:
# 获取滑块图片的下载地址
a = driver.find_elements_by_id('slideBlock')
image2 = a[0].get_attribute('src')
css_str = driver.find_element_by_id('slideBlock').get_attribute("style")
css_list = css_str.split(";")
# 获取滑块的top值
start_top = re.search(r"[0-9]{2}", css_list[2]).group()
# 此处是发现滑块有外边框,所以加上
start_top = int(start_top)
start_top += 11
start_top = start_top * 2
start_top += 23
# print("image1:", image1)
image1_name = 'demo1.png' # 滑块图片名
# 下载滑块图片并存储到本地
target_img = Image.open(BytesIO(requests.get(image2).content))
target_img.save(image1_name)
# 获取图片,并灰化
block = cv2.imread(image1_name, 0)
# 二值化之后的图片名称
block_name = 'demo.jpg'
cv2.imwrite(block_name, block)
img = Image.open("demo.jpg")
img_array = img.load()
top = 0
left = 0
right = 0
bottom = 0
for i in range(23, 112):
top += img_array[i, 23]
for i in range(23, 112):
left += img_array[23, i]
for i in range(23, 112):
right += img_array[111, i]
for i in range(23, 112):
bottom += img_array[i, 111]
rgb_list = [top, left, right, bottom]
if left != max(rgb_list):
a = driver.find_elements_by_id('reload')
time.sleep(random.randint(2, 4))
a[0].click()
time.sleep(1)
else:
return start_top
# 对背景图的分析,确定需要移动的距离
def get_slide_bkg(self, start_top, driver):
# 获取背景大图图片的下载地址
image2 = driver.find_element_by_id('slideBkg').get_attribute('src')
# print("image2:", image2)
image2_name = 'demo2.png' # 背景大图名
# 下载滑块图片并存储到本地
target_img = Image.open(BytesIO(requests.get(image2).content))
target_img.save(image2_name)
# 获取图片,并灰化
block = cv2.imread(image2_name, 0)
# 二值化之后的图片名称
block_name = 'demo2.jpg'
cv2.imwrite(block_name, block)
img = Image.open("demo2.jpg")
img_array = img.load()
rgb_list = []
# 将滑块对应的区域,按像素分成n列,获取每列像素和,差距最大的两列为缺口位置
for i in range(0, 680):
left = 0
for j in range(start_top, start_top + 88):
left += img_array[i, j]
rgb_list.append(left)
for i in range(len(rgb_list) - 1):
if rgb_list[i] - rgb_list[i + 1] > 10000:
dis = (i + 1 - 66) / 2
# 讲需要移动的距离返回
return int(dis)
# 获取移动参数 分割移动距离,放入列表
def get_track(self, distance):
track = []
res = 0
current = 0
mid = distance * 4 / 5
t = 0.2
v = 0
while current < distance:
if current < mid:
a = 2
else:
a = -3
v0 = v
v = v0 + a * t
move = v0 * t + 1 / 2 * a * t * t
current += move
track.append(round(move))
print("获取移动参数正常...")
return track
# 移动滑块,完成验证
def let_slide_block_move(self, start_top, driver):
button = driver.find_element_by_xpath('//*[@id="tcaptcha_drag_button"]')
dis = self.get_slide_bkg(start_top, driver)
track = self.get_track(dis)
# time.sleep(random.randint(1, 3))
# 移动滑块
action = ActionChains(driver)
action.click_and_hold(button).perform()
action.reset_actions() # 清除之前的action
t = 0
# 遍历移动参数列表,完成移动
for i in track:
if len(track) - t < 5:
time.sleep(random.randint(500, 600) / 1000)
action.move_by_offset(xoffset=i, yoffset=0).perform()
action = ActionChains(driver)
t += 1
imitate = ActionChains(driver).move_by_offset(xoffset=-1, yoffset=0)
time.sleep(random.uniform(0.001, 0.007))
imitate.perform()
time.sleep(random.randint(6, 10) / 10)
imitate.perform()
time.sleep(random.uniform(0.001, 0.009))
imitate.perform()
time.sleep(random.uniform(0.001, 0.006))
imitate.perform()
time.sleep(random.uniform(0.001, 0.005))
imitate.perform()
time.sleep(random.uniform(0.01, 0.02))
ActionChains(driver).move_by_offset(xoffset=1, yoffset=0).perform()
# 放开圆球
time.sleep(3)
action.release().perform()
time.sleep(random.randint(1, 3))
# 点击确定
print("拖动正常...")
return driver