这个地方需要使用到的就是python
的selenium
库,这里有一个博客对于安装讲解的很棒,点这里
注意:如果是之前pycharm
已经打开的,切记重新打开一次,否则还是会一直报错(环境变量未更新)
实现Ctrl+S自动化保存页面
思路分析
- 打开火狐浏览器
- 直接键盘Ctrl+S
- 鼠标点击地址栏,输入保存地址
- 点击保存
难点在于精准定位按钮的位置
实现
最终
剩下的唯一难点在于获取所有文章url
,一个简单爬虫即可轻松获取,最终代码如下:
代码文件放在我的github上了
这个地方需要使用到的就是python
的selenium
库,这里有一个博客对于安装讲解的很棒,点这里
注意:如果是之前pycharm
已经打开的,切记重新打开一次,否则还是会一直报错(环境变量未更新)
实现Ctrl+S自动化保存页面
思路分析
- 打开火狐浏览器
- 直接键盘Ctrl+S
- 鼠标点击地址栏,输入保存地址
- 点击保存
难点在于精准定位按钮的位置
实现
最终
剩下的唯一难点在于获取所有文章url
,一个简单爬虫即可轻松获取,最终代码如下:
代码文件放在我的github上了