网易滑动验证码破解

1.滑动验证码

前面介绍了利用 tesserocr 来识别简单的图形验证码,和利用openCV识别滑动验证码的缺口处的位置坐标,本篇文章就正式介绍滑动验证码的破解思路,它需要拖动拼合滑块才可以完成验证,相对图形验证码来说识别难度加大了不少。

阅读全文

[OpenCV_Python]TemplateMatching

Template Matching(模板匹配)

模板匹配是一种在较大图像中搜索和查找模板图像位置的方法。OpenCV提供了一个函数cv2.matchTemplate()。它只是在输入图像上滑动模板图像(如在2D卷积中),并比较模板图像下的输入图像的模板和补丁。在OpenCV中实现了几种比较方法。它返回一个灰度图像,其中每个像素表示该像素的邻域与模板匹配的程度。

阅读全文

[验证码识别]图形验证码识别01

废话

目前许多网站出于安全和反爬的目的,在登录界面,或一些关键操作的地方都设置了验证码,这些验证码的形式也是多种多样的,有普通图形验证码、滑动验证码、点触验证码、宫格验证码等,这些验证码给爬虫开发增加了难度,但也不是没有办法,这篇文章将介绍图片验证码的识别。

阅读全文

[数据可视化]Seaborn简单介绍

什么是Seaborn

Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。同时它能高度兼容numpy与pandas数据结构以及scipy与statsmodels等统计模式。

阅读全文

[数据分析]基于人物登场率生成《倚天》词云图

前言

词云图在文本分析上有着显著的效果,前段时间看完了《倚天屠龙记》,这里使用Python通过jieba库进行小说全文分词,在通过wordcloud库基于小说中人物的登场效率(确切的说是人物名字的出现频率)生成词云图,登场率高的字体更大。先看看看效果,如下图:

阅读全文

[Ubuntu]配置仿MacOS主题

感受一波

之前简洁的Unity桌面用腻了,索性就配置一个仿MacOS的主题,相似度95%以上,当然细节肯定是比不上真正的MacOS系统。这是我配置好了的主题,先来感受一波

阅读全文

[Python3爬虫]selenium爬取淘宝商品信息

前言

前面介绍了使用selenium和chromedriver通过模拟浏览器运行的方式可以做到在浏览器中看到是什么样,抓取的源码就是什么样。不用再去管网页内部的JavaScript是如何渲染页面,也不用管网页后台的Ajax接口有哪些参数,甚至是加密规律等。这篇博客是实战演练,通过Selenium爬取淘宝网商品的图片,名称,价格,购买人数,店铺名称,店铺所在地信息,将结果保存至Mongodb数据库中。

阅读全文

[JSP]搭建开发环境

JSP简介

JSP(Java Server Pages)是在传统的网页HTML文件中插入Java程序段和JSP标记,从而形成JSP文件,后缀名为(*.jsp)。与PHP和ASP.net是目前主流的Web应用程序开发技术路线。与两者相比较具有高性能,跨平台的优势,大型电子商务站点大多使用JSP开发,淘宝网,百度等都大量使用JSP技术。这篇博客着重介绍开发环境的搭建,Linux和Windows环境下都介绍;Intellj和Eclipse也都用。以及介绍JSP项目文件。

阅读全文

[随笔]倚天屠龙记读后感

前言

半个月前看完了倚天屠龙记李连杰的那版电影,觉得不过瘾又连夜刷完苏有朋那版的电视剧,最近有花了一个星期看完了金庸的原著,感触颇深。小说前几章写的是武当创派人张三丰以峨嵋派创始人郭襄的创派和两人的一些往事,接着写的是武当张五侠和白眉鹰王之女鷹素的一段传奇的因缘,生下张无忌,接着以张无忌的成长为主线,铺陈武林的恩恩怨怨,各门各派,你方唱罢我登场,甚是精彩。

阅读全文

[Design Pattern]单例模式

什么是单例模式

单例模式(Single Pattern),被单例的对象只能有一个实例存在。单例模式的实现方式是,一个类只能返回对象的一个引用和一个获得该唯一实例的方法(此方法必须是静态方法)。

阅读全文