Spider-ChromeDriver的安装 ChromeDriver的安装本文字数: 1.8k 阅读时长 ≈ 2 分钟 前面我们成功安装好了Selenium库,但是它是一个自动化测试工具,需要浏览器来配合使用,本节中我们就介绍一下Chrome浏览器及ChromeDriver驱动的配置。 首先,下载Chrome浏览器,方法有很多,在此不再赘述。 随后安装ChromeDriver。因为只有安装ChromeDriver,才能驱动Chrome浏览器 2022-01-30 Coding Python Python Spider ChromeDriver
Spider-Selenium的使用 Selenium的使用本文字数: 17k 阅读时长 ≈ 15 分钟 Selenium是一个自动化测试工具,利用它可以驱动浏览器执行特定的动作,如点击、下拉等操作,同时还可以获取浏览器当前呈现的页面的源代码,做到可见即可爬。对于一些JavaScript动态渲染的页面来说,此种抓取方式非常有效。本节中,就让我们来感受一下它的强大之处吧。 1. 准备工作本节以Chrome为例来讲解Selenium的用法 2022-01-28 Coding Python Python Spider Selenium
Spider-Selenium的安装 Selenium的安装本文字数: 799 阅读时长 ≈ 1 分钟 Selenium是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击、下拉等操作。对于一些JavaScript渲染的页面来说,这种抓取方式非常有效。下面我们来看看Selenium的安装过程。 1. 相关链接 官方网站:http://www.seleniumhq.org GitHub:https://github.co 2022-01-26 Coding Python Python Spider Selenium
解决You can also run `php --ini` in a terminal to see which files are used by PHP in CLI mode 前言解决You can also run php --ini in a terminal to see which files are used by PHP in CLI mode 121) composer update的时候报错 You can also run php --ini inside terminal to see which files are used by PHP in 2022-01-12 Coding PHP PHP Error
Spider-Charles的安装 Charles的安装本文字数: 2.1k 阅读时长 ≈ 12 分钟 Charles是一个网络抓包工具,相比Fiddler,其功能更为强大,而且跨平台支持得更好,所以这里选用它来作为主要的移动端抓包工具。 1. 相关链接 官方网站:https://www.charlesproxy.com 下载链接:https://www.charlesproxy.com/download 2. 下载Charles 2022-01-02 Coding Python Python Spider Charles
在浏览器中使用 OCR Tesseract.js离线版使用 前言使用 Tesseract.js 在浏览器中使用 OCR_tesseract.js离线版使用 光学字符识别或光学字符阅读器 (OCR) 是将文本图像转换为机器编码文本的过程。例如,您可以拍摄书页的图片,然后通过 OCR 软件运行它以提取文本。 在这篇博文中,我们将使用Tesseract OCR 库。Tesseract 是用 C/C++ 编写的,最初是在 1985 年到 1994 年间由 2021-12-20 Coding JavaScript JavaScript Canvas OCR
Tesseract.js将图像OCR转换带给浏览器 前言Tesseract.js将图像OCR转换带给浏览器 OCR转换仍然不是完美的,但是在过去几年中有了很大的改进。 领先的是目前以_C ++_开源的Tesseract 翻译引擎 。 尽管这是一个令人难以置信的库,但是它仅限于软件。 值得庆幸的是,有人将Tesseract移植到JavaScript中,称为Tesseract.js 。 它支持多达60种语言 ,虽然它虽然不完美,但是却做得很好。 安装和 2021-12-18 Coding JavaScript JavaScript Canvas OCR
使用Canvas进行验证码识别 前言使用Canvas进行验证码识别 前两天首页上有篇文章,讲用C#生成验证码.今天又看到一篇文章,讲用python识别验证码.于是我就写了这篇文章,讲用Canvas识别验证码 我们今天要识别的是那种最最简单的验证码,只有随机颜色和随机背景,而没有随机变形,随机噪点. 为了方便试验,我从谷歌中随便搜了一个使用了这种验证码的网站,这种验证码的确很常见 (点击可更换). 分析首先,我们需要分析验证码的生 2021-12-16 Coding JavaScript JavaScript Canvas
各种开源协议License明细 前言各种开源协议License明细 Apache Licence 2.0Apache Licence是著名的非盈利开源组织Apache采用的协议。该协议和BSD类似,同样鼓励代码共享和尊重原作者的著作权,同样允许代码修改,再发布(作为开源或商业软件)。需要满足的条件也和BSD类似: 需要给代码的用户一份Apache Licence 如果你修改了代码,需要在被修改的文件中说明。 在延伸的代码中(修 2021-12-14 Git License Git
介绍一个”牛逼闪闪”开源库:ja-netfilter 前言介绍一个”牛逼闪闪”开源库:ja-netfilter上来先说点题外话,很多人最新说开源项目IDE Eval Resetter不好用了。我就问他为什么不好用了,不好编译了吗?他说不是,是不能在IDE上重置了。我心说,这是个学习研究项目,重在学习插件写法,不能用也实在属于正常。于是我去测试了一下,得出了个结论:2021.2.2及以下版本很好用;2021.3以下(不含)堪堪能用,需要配合一些手法;2 2021-12-12 IDE IDEA Jetbrains Javaagent