C++爬虫原理(十):Https的编程实现(SSL安全通讯)

C++爬虫原理(十):Https的编程实现(SSL安全通讯)
OpenSSL是一套开放源代码的SSL套件,其函数库是以C语言所写成,实现了基本的传输层数据加密功能。此软件是以两个加拿大人Eric A. Young 和Tim J. Hudson所写的SSLeay为基础所发展的,SSLeay随着两人前往RSA公司任职而停止开发。1998年,OpenSSL项目组接管了OpenSSL的开发工作,并推出了OpenSSL的0.9.1版,到目前为止,OpenSSL的算法已经非常完善,对SSL2.0、SSL3.0以及TLS1.0都支持。 OpenSSL同时实现了客...

查询域名当前的DNS服务器

查询域名当前的DNS服务器
1、在线查询:http://tool.chinaz.com/dns/ 用工具网站来查询域名当前DNS服务器的优点是方便,而且像站长之家提供的WHOIS查询工具都有详细中文翻译说明,适合新手使用,但是这样的查询工具一般会有缓存机制,也就是说,查询到的信息不一定是最新的。比如你刚刚在注册商那里修改了DNS服务器,想通过查询域名WHOIS信息来判断注册商是否已刷新DNS解析,那么,这种查询方式有时候也会出现“信息不对称”的情况。 ...

C++爬虫原理(九):Https和Http的区别

C++爬虫原理(九):Https和Http的区别
Https : (Hyper Text Transfer Protocol over Secure Socket Layer),是以安全为目标的HTTP通道,简单讲是HTTP的安全版。即HTTP下加入SSL层,HTTPS的安全基础是SSL,因此加密的详细内容就需要SSL。 它是一个URI scheme(抽象标识符体系),句法类同http:体系。用于安全的HTTP数据传输。https:URL表明它使用了HTTP,但HTTPS存在不同于HTTP的默认端口及一个加密/身份验证层(在HTTP与TCP之间)。这个系统的...

C++爬虫原理(八):正则知识和Boost在VS中的应用

C++爬虫原理(八):正则知识和Boost在VS中的应用
一、正则的知识?什么是正则?正则是干什么用的?正则的应用? 请参考以下教程:正则表达式30分钟入门教程 二、正则表达式中一些常见的元字符 正则表达式 (总结 by: cplusplus.me ): ^ : 表示 行的开始,^放在[]中表示排除的意思 $ : 表示 行的结束 \b : 表示 单词定界符 \B : 表示 不能是一个完整的单词 [] : 表示 方括号内只能匹配一个字符。eg: [Tt]忽略大小写 | : 表示 或。eg: T|t忽略大小写。 注:...

CentOS 6.x安装MySQL 5.6-5.7(RPM安装)

CentOS 6.x安装MySQL 5.6-5.7(RPM安装)
一、确定版本号 uname -a 或 cat /etc/redhat-release 二、下载Mysql的yum仓库 http://dev.mysql.com/downloads/repo/yum/ 三、安装yum仓库 sudo yum localinstall mysql-community-release-el6-5.noarch.rpm(你下载的rpm) 四、查看可安装的版本 yum repolist all | grep mysql 五、选择安装版本 1、仓库中启用5.7版本的,禁用5.6版本子仓库 sudo yum-config-manager --disable mysql56-community sudo yum...

C++爬虫原理(七):布隆过滤器和暴雪字符串哈希的思考

C++爬虫原理(七):布隆过滤器和暴雪字符串哈希的思考
结合布隆过滤器按位存储的思想,和暴雪字符串哈希算法的思想,写出适合所写程序的哈希。(主要参考,布隆过滤器) 如下: 一、首先申请约为1亿比特位的空间 = 1亿/8 字节 = 13MB,8次哈希,所以需要 8*13MB = 100MB的内存。 这里我为什么要取接近1亿的质数为哈希表大小呢?大约测试了8-9个垂直行业站点,数据量随机(几十万到千万),URL相似度存在高度相似等情况,这里有个奇怪的现象,在哈希表大小为1亿...

SQL联合查询(内联、左联、右联、全联)

SQL联合查询(内联、左联、右联、全联)
联合查询效率较高,以下例子来说明联合查询(内联、左联、右联、全联)的好处:     T1表结构 (用户名,密码) userid (int) username varchar(20) password varchar(20)   1 jack jackpwd   2 owen owenpwd        T2表结构 (用户名,密码) userid (int) jifen varchar(20) dengji varchar(20)   1 20 3   3 50 6 第一:内联(inner  join)。 ...

C++爬虫原理(五):编码和解码URL_UTF-8

C++爬虫原理(五):编码和解码URL_UTF-8
C++爬虫原理(五):编码和解码URL,UTF-8方式,网上大多数是ansi方式的编码,即:UTF-8,UrlEncode编码/UrlDecode解码: 一个CString版的代码如下(项目需要随手写了一个): CString CTestDlg::URLEncode(CString str) { int len = MultiByteToWideChar(CP_ACP,0,str.GetBuffer(0),-1,NULL,0); str.ReleaseBuffer(); wchar_t *unicode = new wchar_t[len]; MultiByteToWideChar(CP_ACP,0,str.GetBuf...

Hyper-V虚拟机差异磁盘克隆系统

Hyper-V虚拟机差异磁盘克隆系统
            Hyper-V虚拟机差异磁盘克隆系统 1、  首先去掉模板的SID值,这里用2003来举例,在2003的安装盘中拷贝这个两个文件到桌面或者C盘 2、  执行其中的sysprep.exe文件,如图 等关机之后在把VHD磁盘拷贝到另外位置,这个拷贝的文件就是你差异磁盘的文件 3、  在Hyper-V服务器上面选择新建磁盘,在新建磁盘类型中选择差异 4、  在指定名称和位置这里写上你名称和位置 5、  给查差异磁...
Copyright © C/C++程序员之家 保留所有权利.   Theme  Ality 浙ICP备15011757号-3

用户登录