1. 关于“匹配”一词的理解。
这是正则表达式用的最多的词,但是这个词对于初学者常常给人忽远忽近的感觉,有时候感觉理解了,有时候又觉得被绕进去了,离真正理解还很远。
我们在windows电脑上搜索文件,比如要搜所有MP4格式的视频,可以在搜索栏中输入“*.MP4”,搜索出来的文件就是mp4视频文件,假设搜索结果如下:
精通java.mp4 战狼2.MP4 三国央视版.MP4
用正则词汇来说,“*.MP4”匹配“精通java.mp4”、“战狼2.MP4”、“三国央视版.MP4”等字符串。
用我们通俗的话来说,“*”字符能代表“精通java”、“战狼2”、“三国央视版”等字符串,匹配就是这个正则表达式能代表这个字符串。
匹配结果,就是按照正则表达式的规则,在字符串中能不能找到符合此规则的字符串,能找到多少个字符串。如果不能找到称为不匹配,如果能找到一个或者多个,则每一个都称为一个匹配。
匹配这个词之所以常常令人费解,那是因为很多书把这个词义经常混淆一起用,把初学者搞晕了。
匹配有三种形式的存在:
——形容词性质的匹配:一个字符串“契合”一个正则,用于判断输出true或false。
——动词性质的匹配:在字符串中搜索符合正则的字符串。
——名词性质的匹配:字符串中满足正则的一部分,每一个部分都称为一个匹配。
这几个混在一起,很容易把人搞懵了。其实你只需要记住,匹配就是根据正则表达式这个“规则”,能在字符串中找到子字符串,就是匹配,就是这么简单。
2. 关于字符串的理解
正则表达式是判断、搜索字符串的专门语言,处理的一切对象都是字符串(文本也是字符串的一种,只不过包含换行等特殊符号而已),没有其他数据类型之分。
比如,对“18790”,我们在其它语言如C、Java、PHP中会认为这是一个数字,是一个整体,但是在正则中,它只是由5个数字组成的字符串,对,只是字符串而已,和“abcde”性质是一样的,并非一整数。
在正式进入正则学习之前,先安利几个好用的校验和测试工具:
1. 在线正则结构分析工具 regexper。
regexper以直观的图例展现正则的结构,对分析和编写正则非常有帮助。
2. 正则在线测试工具regex101
regex101使用无需注册,打开即用。它不仅能快速响应匹配结果,设定各种匹配模式,还具有动态展现匹配过程功能的调试模式,对匹配过程以动画形式展现,是一款很赞的正则引擎。
3. 本地正则测试工具RegexBuddy
这是一个比较经典的正则工具,官网地址:http://www.regexbuddy.com/
RegexBuddy是个收费软件,不过网上有很多和谐版的下载,各位自行找度娘要吧。
近期为大数据分析部门培训Excel高级运用,涉及到正则、SQL、VBA的运用,借此备讲机会写一个想了很久但没做的正则教程。
市面上的正则表达式书籍琳琅满目,包括很多命名为《精通正则表达式》《深入浅出学习正则表达式》《正则表达式从入门到精通》《XX天精通正则表达式》…的书籍, 但真正能做到浅显易懂的寥寥无几。正则本身语言结构不友好,逻辑抽象,很多初学者感觉非常吃力,而借助的书籍往往是以“编著”凑数的书,很难啃。
本教程力求以最简明的方式,清晰的逻辑带你全面了解正则表达式。
一.第一步:创建socket套接字。
socket_create ( int $domain
, int $type
, int $protocol
) : resource
创建并返回一个套接字,也称作一个通讯节点。一个典型的网络连接由 2 个套接字构成,一个运行在客户端,另一个运行在服务器端。(socket_create() 正确时返回一个套接字,失败时返回 FALSE。要读取错误代码,可调用 socket_last_error())
domain
的可选参数:
AF_INET: IPv4 网络协议。TCP 和 UDP 都可使用此协议。 AF_INET6: IPv6 网络协议。TCP 和 UDP 都可使用此协议。 AF_UNIX: 本地通讯协议。具有高性能和低成本的 IPC(进程间通讯)。
type
参数用于选择套接字使用的类型,可选值有:
SOCK_STREAM 提供一个顺序化的、可靠的、全双工的、基于连接的字节流。支持数据传送流量控制机制。TCP 协议即基于这种流式套接字。 SOCK_DGRAM 提供数据报文的支持。(无连接,不可靠、固定最大长度).UDP协议即基于这种数据报文套接字。 SOCK_SEQPACKET 提供一个顺序化的、可靠的、全双工的、面向连接的、固定最大长度的数据通信;数据端通过接收每一个数据段来读取整个数据包。 SOCK_RAW 提供读取原始的网络协议。这种特殊的套接字可用于手工构建任意类型的协议。一般使用这个套接字来实现 ICMP 请求(例如 ping)。 SOCK_RDM 提供一个可靠的数据层,但不保证到达顺序。一般的操作系统都未实现此功能。
protocol参数可选值:
tcp、udp和icmp
可以看出socket_create函数的type参数和protocol参数是相关联的。
二. 第二步:开启套接字链接。
socket_connect ( resource $socket
, string $address
[, int $port
= 0 ] ) : bool
成功时返回 TRUE
, 或者在失败时返回 FALSE
。 错误代码会传入 socket_last_error()
ADDRESS参数:
如果参数 socket
是 AF_INET
, 那么参数 address
则可以是一个点分四组表示法(例如 127.0.0.1 ) 的 IPv4 地址; 如果支持 IPv6 并且 socket
是 AF_INET6
,那么 address
也可以是有效的 IPv6 地址(例如 ::1);如果套接字类型为 AF_UNIX
,那么 address
也可以是一个Unix 套接字。
PORT参数:
仅仅用于 AF_INET
和 AF_INET6
套接字连接的时候,并且是在此情况下是需要强制说明连接对应的远程服务器上的端口号。
三. 第三步:socket_bind — 给套接字绑定名字
socket_bind ( resource $socket
, string $address
[, int $port
= 0 ] ) : bool
绑定 address
到 socket
。 该操作必须是在使用 socket_connect() 或者 socket_listen() 建立一个连接之前。
成功时返回 TRUE
, 或者在失败时返回 FALSE
。
四. 监听套接字:socket_listen()
….待续
PHP的MVC模式相比其他语言有快捷、简单的显式优势,其中原因之一就是PHP支持可变变量、可变函数、可变类、匿名函数等,很方便实现了动态调用。
匿名函数(闭包closures)最常用于回调,以下为官方文档的示例:
echo preg_replace_callback('~-([a-z])~', function ($match) { return strtoupper($match[1]); }, 'hello-world'); // 输出 helloWorld
声明匿名函数可将其赋与一个变量。PHP 会自动把此种表达式转换成内置类 Closure 的对象实例。把一个 closure 对象赋值给一个变量的方式与普通变量赋值的语法是一样的,最后也要加上分号:
$greet = function($name) { printf("Hello %s\r\n", $name); }; //这里需要加分号 $greet('World'); $greet('PHP');
匿名函数可以从父作用域中继承变量。 任何此类变量都应该用 use 语言结构传递进去。 PHP 7.1 起,不能传入此类变量:superglobals、 $this 或者和参数重名。 (更多…)
一. 在同一数组变量中,索引关联同时并存时的索引引用规律:
PHP中数组分索引数组与关联数组,并且索引数组与关联数组能同时共存,例如:
$myarray = array("foo","bar","site"=>"mosang",123);
我们var_dump该数组变量,结果如下:
array(4) { [0]=> string(3) "foo" [1]=> string(3) "bar" ["site"]=> string(6) "mosang" [2]=> int(123) }
可以看到,该数组中的关联项”site”=>”mosang”并没有占用数组下标,下标引用最大值是2。
echo $myarray[0]."<br>"; echo $myarray[1]."<br>"; echo $myarray[2]."<br>";
输出结果(并没有“mosang”值):
foo bar 123
二. 关联数组中的key如果为整数字符串,则key自动转化为数组索引值:
$mixarray = array("60"=>"mosang.net",88,"heiry"); var_dump($mixarray); //输出如下: array(3) { [60]=> string(10) "mosang.net" [61]=> int(88) [62]=> string(5) "heiry" }
可以看出,key“60”自动转成了数组索引,并且之后的索引值在此基础上增加。
$mixarray = array(88,"60"=>"mosang.net","heiry"); var_dump($mixarray); //输出结果如下 array(3) { [0]=> int(88) [60]=> string(10) "mosang.net" [61]=> string(5) "heiry" }
这种情况下,我们不能以数组长度for循环遍历。
三.手动指定数组索引,如果该索引值与之前相同,则之前的值会被覆盖:
$mixarray_2 = array("first","second","0"=>"third"); var_dump($mixarray_2); //输出结果如下 array(2) { [0]=> string(5) "third" [1]=> string(6) "second" }
可见:该数组实际上只有两个元素,原索引0值“first”的元素已经被覆盖。
count统计时会统计两种数组的总个数,因此混合数组中,不能使用for循环来遍历(造成越界)。
四. 混合数组的强制类型转换
——包含有合法整型值的字符串会被转换为整型。例如键名 “8” 实际会被储存为 8。但是 “08” 则不会强制转换,因为其不是一个合法的十进制数值。
——浮点数也会被转换为整型,意味着其小数部分会被舍去。例如键名 8.7 实际会被储存为 8。
——布尔值也会被转换成整型。即键名 true 实际会被储存为 1 而键名 false 会被储存为 0。
——Null 会被转换为空字符串,即键名 null 实际会被储存为 “”。
——数组和对象不能被用为键名。坚持这么做会导致警告:
$array = array( 1 => "a", "1" => "b", 1.5 => "c", true => "d", ); var_dump($array);
输出结果:
array(1) { [1]=> string(1) "d" } //所有的键名都被强制转换为 1,则每一个新单元都会覆盖前一个的值,最后剩下的只有一个 "d"
五.同一个数组元素,只能有一种有效访问方式(数组下标和者关联名称其中之一):
$myarray = ["student1"=>"迪丽热巴","student2"=>"马尔扎哈","student3"=>"古力娜扎"]; foreach ($myarray as $item => $value){ echo "key为{$item}的值是:{$value}<br>"; } echo "第一个学生的姓名为:".$myarray[0];
输出结果:
key为student1的值是:迪丽热巴 key为student2的值是:马尔扎哈 key为student3的值是:古力娜扎 第一个学生的姓名为:
可见都是关联数组,使用下标不能访问到元素。
$myarray = ["student1"=>"迪丽热巴","马尔扎哈","student3"=>"古力娜扎"]; foreach ($myarray as $item => $value){ echo "key为{$item}的值是:{$value}<br>"; } echo "第一个学生的姓名为:".$myarray[0];
输出如下:
key为student1的值是:迪丽热巴 key为0的值是:马尔扎哈 key为student3的值是:古力娜扎 第一个学生的姓名为:马尔扎哈
腾讯行为验证码QQcaptcha提供免费版的API(支持不大于2000次/小时的请求),依靠腾讯强大的云计算平台和大数据处理能力,QQcaptcha稳定性、可靠性属上乘,是中小应用安全验证的不错选择(介绍详见:http://www.mosang.net/575.html)。
接入也不复杂,以下为接入教程(PHP版):
1. 打开链接 https://007.qq.com/captcha/ 登录申请。
2. 绑定域名,新建验证码。可以需要选择应用场景(登录验证、秒杀、抽奖等)
3.成功后即可获得APP ID及App Secret Key。
4. 客户端接入:
a.引入JavaScript文件,在<head>区域引入JavaScript脚本:
<script src="https://ssl.captcha.qq.com/TCaptcha.js"></script>
b. 创建激活DOM对象(通过ID指定,默认为click事件触发)
<!--点击此元素会自动激活验证码--> <!--id : 元素的id(必须)--> <!--data-appid : AppID(必须)--> <!--data-cbfn : 回调函数名(必须)--> <!--data-biz-state : 业务自定义透传参数(可选)--> <button id="TencentCaptcha" data-appid="8888888" <!--这里"8888888"换成你自己的APP ID--> data-cbfn="callback" >点击认证</button>
c.为验证码创建回调函数(函数名与上一步data-cbfn指定的相同)
window.callback = function(res){ console.log(res) // res(用户主动关闭验证码)= {ret: 2, ticket: null} // res(验证成功) = {ret: 0, ticket: "String", randstr: "String"} if(res.ret === 0){ alert(res.ticket) // 票据 } }
上面是官方给出的示例,实际应用代码参考如下:
window.callback = function(res){ if(res.ret === 0){ $.post("http://www.mosang.net/isallowlogin.php",//异步发送ticket和randstr到服务端 { ticket:res.ticket, randstr:res.randstr }, function(data,status){ if(data.allowLogin == "yes"){ alert("防恶意行为认证成功"); } else { alert("防恶意行为认证失败"); }; }); } }
5. 服务器端验证程序isallowlogin.php,向腾讯服务器发送GET请求,具体参数参照官方给出列表:
isallowlogin.php请求及返回数据参考如下:
<?php $ip = $_SERVER['REMOTE_ADDR']; $ticket = $_POST["ticket"]; $randstr = $_POST["randstr"]; $tagetUrl='https://ssl.captcha.qq.com/ticket/verify?aid=888888&AppSecretKey=0wLlYnHsmrfrfrfr&Ticket='.$ticket.'&Randstr='.$randstr.'&UserIP='.$ip; //这里aid参数换成你自己的APPID值 ,AppSecretKey参数换成你自己的AppSecretKey值。 $resData = file_get_contents($tagetUrl);//向腾讯服务器发起GET请求 header('Content-type:text/json;charset=utf-8'); $info = json_decode(trim($resData,chr(239).chr(187).chr(191)),true);//去掉BOM头的不可见字符,并转化为数组 if($info["response"] == 1){ session_start(); $_SESSION['Login'] = "yes"; echo('{"allowLogin":"yes"}'); } else { echo('{"allowLogin":"no"}'); } ?>
至此,接入完成,是不是很简单?