前期准备
安装所用到的包
bs4
和 re
安装步骤
快捷键:Ctrl+Shift+S
注:如果登录了QQ等包含快捷键应用可能会产生热键冲突,解决方法就是去手动点击”Setting(设置)”
找到Project:‘你的项目名’
展开,第二个栏目
点击右上角的加号进行搜索上面说到的两个包名
注:如果安装错误请首先升级’pip’,升级’pip’成功后即可继续安装
项目代码
# import bs4 from bs4 import BeautifulSoup # 从bs4包里导入BeautifulSoup import urllib.request # 导入request包 import re # 导入re包 # import urllib.parse # 导入包 # from lxml import etree header = {'User-Agent':' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36 Edg/88.0.705.50'} html = urllib.request.urlopen("http://www.lctvu.sd.cn",data=None) bs = BeautifulSoup(html,'lxml') # print(bs) r = bs.find_all(text=re.compile("聊城职院")) for i in r: print(i)