JavSP
JavSP copied to clipboard
建议新增arzon刮削用于nfo文件中plot字段。
功能建议
建议新增arzon刮削用于nfo文件中plot字段。 javsdt参考代码如下:
`
-- coding:utf-8 --
import requests, re from os import system
from traceback import format_exc
功能:获取一个arzon_cookie
参数:代理proxy
返回:cookies
def steal_arzon_cookies(proxy): print('\n正在尝试通过 https://www.arzon.jp 的成人验证...') for retry in range(10): try: # 当初费尽心机,想办法如何通过页面上的成人验证,结果在一个C#开发的jav爬虫项目,看到它请求以下网址,再跳转到arzon主页,所得到的的cookie即是合法的cookie if proxy: session = requests.Session() session.get('https://www.arzon.jp/index.php?action=adult_customer_agecheck&agecheck=1&redirect=https%3A%2F%2Fwww.arzon.jp%2F', proxies=proxy, timeout=(12, 7)) print('通过arzon的成人验证!\n') return session.cookies.get_dict() else: session = requests.Session() session.get('https://www.arzon.jp/index.php?action=adult_customer_agecheck&agecheck=1&redirect=https%3A%2F%2Fwww.arzon.jp%2F', timeout=(12, 7)) print('通过arzon的成人验证!\n') return session.cookies.get_dict() except requests.exceptions.ProxyError: # print(format_exc()) print(' >通过局部代理失败,重新尝试...') continue except: # print(format_exc()) print('通过失败,重新尝试...') continue print('>>请检查你的网络环境是否可以打开:https://www.arzon.jp/') system('pause')
功能:搜索arzon,或请求arzon上jav所在网页
参数:网址url,请求头部header/cookies,代理proxy
返回:网页html
def get_arzon_html(url, cookies, proxy): # print('代理:', proxy) for retry in range(10): try: if proxy: rqs = requests.get(url, cookies=cookies, proxies=proxy, timeout=(12, 7)) else: rqs = requests.get(url, cookies=cookies, timeout=(12, 7)) except requests.exceptions.ProxyError: # print(format_exc()) print(' >通过局部代理失败,重新尝试...') continue except: print(' >打开网页失败,重新尝试...') continue rqs.encoding = 'utf-8' rqs_content = rqs.text if re.search(r'arzon', rqs_content): return rqs_content else: print(' >打开网页失败,空返回...重新尝试...') continue print('>>请检查你的网络环境是否可以打开:', url) system('pause')
功能:从arzon上查找简介
参数:车牌car,cookies,proxy
返回:简介,执行完成状态码,cookies
def find_plot_arzon(car, cookies, proxy): for retry in range(2): url_search_arzon = 'https://www.arzon.jp/itemlist.html?t=&m=all&s=&q=' + car.replace('-', '') print(' >查找简介:', url_search_arzon) # 得到arzon的搜索结果页面 html_search_arzon = get_arzon_html(url_search_arzon, cookies, proxy) #
'): line = line.strip() plot += line return plot, 0, cookies # 几个搜索结果查找完了,也没有找到简介 return '【arzon有该影片,但找不到简介】', 1, cookies # 没有搜索结果 else: # arzon返回的页面实际是18岁验证 adultg = re.search(r'18歳未満', html_search_arzon) if str(adultg) != 'None': cookies = steal_arzon_cookies(proxy) continue # 不是成人验证,也没有简介 else: return '【影片下架,暂无简介】', 2, cookies print('>>请检查你的网络环境是否可以通过成人验证:https://www.arzon.jp/') system('pause') return '', 3, cookies
`