我现在需要高中的地址。高中存储在Excel表格中,名称统一在第一列,可以有多个表格。
利用高德地图实现自动查询存储
当时我在Excel上学会了一些硒的用法和操作,然后写了一些东西:
合理使用,届时可能搜索过于频繁,网页会被验证,然后只能退出重新进入重新访问。
Selenium和请求爬虫
前几天我用requests crawler练习,突然遇到一个问题:F12显示的代码和Ctrl+U显示的代码(我们在程序中得到的)不一样。这导致无法继续对请求进行爬网。
后来,我检查了web页面上的某些内容需要动态加载,也就是说,当我们到达那个位置时,它就开始加载,一次加载就完成了请求。所以我们得用硒来解决。Selenium主要用于一些动态加载网页的爬虫,当然也可以是静态的;请求主要用于爬行静态网页。
webdriver是一个浏览器驱动程序:
刚开始使用时,我遇到了一些问题:打不开浏览器--“没有驱动,要下载相应浏览器版本的驱动,放到python目录下;还要注意配置path环境变量,添加浏览器目录”。
ActionChains主要用于模拟一些行为,如将光标移动到指定位置、点击、输入、清空等,并可搜索相关用途。
Xlrd是一个用于读取Excel表的库
XWT是一个用于编写Excel表的库