本文共 1241 字,大约阅读时间需要 4 分钟。
自然而然地就看见关键字是page,修改&page就可以翻页
获取书名和作者地在网页中的信息
第一步,确定步骤,并将所有的步骤
第二步,逐步完善
from bs4 import BeautifulSoupimport requests# 获取相关的网址def getHTML(url): r = requests.get(url,timeout = 30) r.raise_for_status() r.encoding = r.apparent_encoding return r.text# 对网页的text内容进行分析def paesrHTML(text,ilt): soup = BeautifulSoup(text,'html.parser') for i in soup('h4'): ilt.append(i.string)# 将分析的内容进行输出def printMessage(ilt): text = '{:<10}\t{:<10}' print(text.format("序号","书名")) count = 1 for i in ilt: print(text.format(count,i)) count += 1def main(): url = "https://www.ituring.com.cn/book?tab=book&sort=hot&page=" page = 0 ilt = list() for i in range(4): text = getHTML(url + str(i)) paesrHTML(text,ilt) printMessage(ilt)main()
转载地址:http://rrgpb.baihongyu.com/