博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
ECMA_RegExp
阅读量:6083 次
发布时间:2019-06-20

本文共 8502 字,大约阅读时间需要 28 分钟。

正则基础

定义:它就是一个规则,用来处理字符串的一个规则

用来处理字符串的一个规则 (正则只能处理字符串)

  1. 判断一个字符串是否符合制定的规则 regexp.test(string)匹配
  2. 把字符串中符合正则的规则捕获到 regexp.exec(string)捕获

正则的处理统称为两个方面:正则的匹配正则的捕获

功能:检索、替换、校验

创建正则对象

字面量方式:

var reg = /\d/;

实例创建方式:

var reg = new RegExp('\d'); // 参数是正则字符串

两种创建方式的区别:

  1. 字面量方式不能拼接字符串,//之间包起来的所有内容都是元字符
  2. 实例创建方式不认识元字符,需要通过转义.
var reg = new RegExp('^\\d+' + name + '\\d+$', 'g');

元字符

每个表达式都是由元字符和修饰符组成的

元字符:在//之间具有意义的一些字符

特殊意义的元字符

\ 转义字符

^ 以某一个元字符开始
$ 以某一个元字符结尾
\n 匹配一个换行符
. 除了\n以外的任意字符
() 分组, 一个大的正则划分为具体的小正则.
x|y|z x,y,z其中的一个
[xyz] x,或者y,或者z,其中的一个
[^xyz] 非,除了x,y,z中的任何一个字符串
[a-z] a-z中的任何一个字符
[^a-z] 除了a-z任意一个字符
\d 包含0-9之间的数字
\D 除了0-9之间的数字以外的任何字符
\b 匹配一个边界符
\w[0-9a-zA-Z_],数字,字母,下划线的任意一个字符
\s 匹配一个空白字符: 空格, 制表符,换页符 ...

var reg = /\d/; // 包含0-9之间的数字var reg2 = /^\d$/; // 只能是一个0-9之间的数字
代表出现次数的量词元字符

* 零到多次(不出现,1次,100次)

+ 一到多次(至少需要一次)
? 零次或者一次(可能出现;可能不出现,但是出现只出现一次)
{n} n次
{n, }n到多次
{n, m} n到m次

注意点:

  1. []中出现的所有字符都是代表本身意思的字符(没有特殊含义)
  2. []中不识别两位数
  3. 分组的作用改变x|y默认的优先级 例如:/^18|19$/ 变成 /^(18|19)$/ 只能是18或19.
  4. 分组可以一直有^,$的效果
// 有效数字正则 , 整数,负数,0,小数 // 12, 12.1, -12, +12, 0.2, // 不是有效数字情况:09 ,00ffxx, 0011// 1. "."可以出现也可以不出现,但是一旦出现,后面必须跟着一位或者多位数字// 2. 最开始可以有+/-,也可以没有// 3. 整数部分,一位数可以是0-9之间的一个,多位数不能以0开头。var reg = /^[+-]?(\d|([1-9]\d+))(\.\d+)?$/;

简单常用的正则

匹配年龄
// 匹配年龄 , 年龄介于18-65之间var reg = /^(1[8-9])([2-5]\d)(6[0-5])$/; // 18-19 20-59 60-65var reg = /^(1[8-9]|[2-5]\d|6[0-5])$/;

不能直接使用18-65之间,就划分10以内的数字.

错误写法:

var reg = /^[18-65]$/;

[]中不识别两位数

var reg = /^[12]$/; // 1或2中的其中一个var reg = /^[12-68]$/; // (1, 2-6其中的一个,8,)其中的一个// 数字,字母,下划线,中杆var reg = /^[\w-]$/;
验证邮箱

简版验证:

// `@`分割,左边为:数字,字母,下划线,.,-var reg = /^[\w.-]+@[0-9a-zA-Z]+(\.[a-zA-Z]{2,4}){1,2}$/;

正则表达式:从现实的抽象成规律,一部分,一部分解决。

身份证号码验证

简版身份证验证:

var reg = /^\d{17}(\d|X)$/;var reg = /^(\d){2}(\d{4})(\d{4})(\d{2})(\d{2})(\d{2})(\d)(\d|X)$/;  // 增加分组
非空验证
var reg = !/^\s*$/;
去首尾空格
var reg = /^ +| +$/g;
去除html注释
var reg = /<\!--[\s\S]*?-->/g;

捕获

exec()

捕获个格式:
是一个数组,数组中的第一项是正则捕获的内容,第二项是捕获在字符串的索引位置,第三项是原始字符串

var reg = /\d+/;console.log(reg.exec('sf11')); // [ '11', index: 2, input: 'sf11' ]

exec分为两个阶段:

  1. 每一次捕获的时候都是先进性默认的匹配,如果没有匹配成功的,捕获的结果是null
  2. 如果匹配成功,默认匹配第一匹配的内容

正则捕获特点:

懒惰性:每一次执行
exec只捕获第一个匹配的内容,在不进行任何处理的情况下,再执行多次捕获,捕获的还是第一次匹配到的内容

clipboard.png

lastIndex 是正则每次捕获在字符串中开始查找的位置,默认值是:0

解决正则懒惰性,在正则末尾增加修饰符"g"

i :igoreCase(i), 忽略大小写匹配

m : multiline(m), 多行匹配
g : global(g),全局匹配

加全局修饰符g,每次正则捕获结束后,会把lastIndex的值变为最新的值,下次捕获,从最近的值开始查找.

// 全局修饰符var reg = /\d+/g;var str = 'sf11aaa111';  var res = reg.exec(str);var arr = [];while(res) {  arr.push(res[0]);  res = reg.exec(str);}
贪婪性: 正则的每次捕获都是按照匹配最长的结果捕获的。
var reg = /\d+/g;var str = 'sf2017aaa2018';  var res = reg.exec(str);

例如: 2符合正则 2017也符合,默认捕获的是2017

解决正则的贪婪性:在量词元字符后边添加
?
// 只需要匹配2,而不需要匹配2017var reg = /\d+?/g;var str = 'sf2017aaa2018';var res = reg.exec(str);  console.log(res);
?在正则中的作用
  1. 放在一个普通元字符后面表示出现0-1次。 例如:/\d?/ 出现0或1次数字, 数字可能出现也可能不出现.
  2. 放在一个量词元字符后边,是取消捕获时候的贪婪性。 例如:/\d+?/g 出现一个数字.

match()

把所有和正则匹配的字符都获取到.

var reg = /\d+/g;var str = 'sf2017aaa2018';var arr = str.match(reg);console.log(arr); // ["2017", "2018"]

match()exec()区别:

  1. match获取一次,exec需要多次获取
  2. match中存在一些问题,在分组捕获的情况下,match只能捕获到大正则匹配的内容,而无法捕获到小正则捕获的内容.

分组捕获

正则分组的作用:

  1. 改变优先级
  2. 分组引用
  3. 分组捕获
分组引用
// 分组引用var reg = /^(\w)\1(\w)\2$/; // `\2`表示和第二个分组出现一样的东西 , `\1`表示和第一个分组出现一样的东西.console.log(reg.test('zzff')); // trueconsole.log(reg.test('z1f_')); // false
分组捕获

正则在捕获的时候,不仅仅把大正则匹配的内容捕获到,而且还可以把小分组匹配的内容捕获到.

var reg = /^(\d{2})(\d{4})(\d{4})(\d{2})(\d{2})(\d{2})(\d)(\d|X)$/;var str = "350426199403118019";console.log(reg.exec(str)); // arr = ["350426199403118019", "35", "0426", "1994", "03", "11", "80", "1", "9", index: 0, input: "350426199403118019"]// arr[0] -> 大正则匹配的内容// arr[1] -> 第一个分组捕获的内容// arr[2] -> 第二个分组捕获的内容// arr[3] -> 第三个分组捕获的内容// ... // 这种现象就是分组捕获

(?:) 在分组中 ?:只匹配,不捕获.

var reg = /^(\d{2})(\d{4})(\d{4})(\d{2})(\d{2})(?:\d{2})(\d)(?:\d|X)$/;var str = "350426199403118019";console.log(reg.exec(str)); // arr = ["350426199403118019", "35", "0426", "1994", "03", "11", "1", index: 0, input: "350426199403118019"]

replace

把原有的字符替换成新的字符

每当执行一次replace只能替换一个字符

replace的一个参数是正则:

把所有正则匹配的内容捕获到,然后捕获的内容替换成需要替换的新内容。

第二个参数可以是:

  1. 固定的字符串值
  2. 回调函数 (正则在字符串中捕获多少次,回调函数就执行几次);每一次执行匿名函数,里面传递的参数值arguments和exec捕获到的结果是非常的类似的(即使正则有分组,同样可以通过arguments获取到分组捕获的内容);return 返回的是什么,就相当于把当前的这一次大正则捕获的内容替换成返回的内容。
// 参数和returnvar str = 'xixi2017xixi2018';str = str.replace(/\d+/g, function() {  // console.log(arguments);   // ["2017", 4, "xixi2017xixi2018", callee: function, Symbol(Symbol.iterator): function]   // ["2018", 12, "xixi2017xixi2018", callee: function, Symbol(Symbol.iterator): function]  return 222222; // 返回的值,把每次大正则匹配捕获的内容都替换该值});console.log(str); // xixi222222xixi222222
替换字符串中的数字为中文数字
var str = '20170606'; // -> 贰零壹柒零陆零陆var arr = ['零', '壹', '贰', '叁', '肆', '伍', '陆', '柒', '捌', '玖'];var reg = /\d/g;str = str.replace(reg, function($1) {  console.log($1);  return arr[$1];});console.log(str);
获取一个字符串中出现次数最多的字符
var str = 'abaaaasdffasd';var reg = /\w+?/gi;var obj = {};str.replace(reg, function($0) {    if (obj[$0] >= 1) {    obj[$0] += 1;  } else {    obj[$0] = 1;  }});console.log(obj);// 获取最大的,出现字符最多的。 // 在对象中获取出现最多次数,把出现最多字符拿出。// 在一个对象获取最大值: 假设法// 在数组中获取最大值:1. 排序。 2. 假设法, 3. Math.max();// 获取最多出现的次数var maxNum = 0;for (var i in obj) {  if (obj[i] > maxNum) {    maxNum = obj[i];  }  }// 获取所有符合出现maxNum次数的都获取到var resArr = [];for (var key in obj) {  if (obj[key] == maxNum) {    resArr.push(key);  }}console.log(maxNum, resArr.toString());
url 处理参数
var url = 'http://www.weibo.com/u/5688069917?pids=Pl_Official_MyProfileFeed__21&profile_ftype=1&is_all=1#_0';var reg = /([^?=&]+)=([^?=&]+)/g;var res = reg.exec(url);var obj = {};while(res) {  obj[res[1]] = res[2];  res = reg.exec(url);}console.log(obj); // Object {pids: "Pl_Official_MyProfileFeed__21", profile_ftype: "1", is_all: "1#_0"}

var url = 'http://www.weibo.com/u/5688069917?pids=Pl_Official_MyProfileFeed__21&profile_ftype=1&is_all=1#_0';var reg = /([^?=&]+)=([^?=&]+)/g;var res = reg.exec(url);var obj = {};url.replace(reg, function($0, $1, $2) {  obj[$1] = $2;});console.log(obj); // Object {pids: "Pl_Official_MyProfileFeed__21", profile_ftype: "1", is_all: "1#_0"}
时间字符串格式化
// "2017-6-7 23:43:12" --> "2017年06月07日  23时:43分12秒"var str = '2017-6-7 23:43:12';// 方法一: 字符串变数组, 通过空格,拆成两项 // ['2017-6-7', '23:43:12'] var arr1 = str.split(' ');var arrL = arr1[0].split('-'); // ["2017", "6", "7"]var arrR = arr1[1].split(':'); // ["23", "43", "12"]// 方法二: 时间格式字符串,变成时间格式对象 通过new Date();var d = new Date(str.replace('-', '/').replace('-', '/')); // 然后通过 时间对象的操作方式 来操作// ie 浏览器中,不识别 '-' , 需要替换成 '/'// 方法三: 正则方式, 模板匹配的方式 . 设定好目标格式,把数组中固定的项替换成指定的区域内.var str = '2017-6-7 23:43:12', resStr = '{0}年{1}月{2}日  {3}时:{4}分{5}秒';// var reg1 = /\d+/g;// var arrDate = str.match(reg1);var reg1 = /^(\d{4})[-\/](\d{1,2})[-\/](\d{1,2}) +(\d{1,2}):(\d{1,2}):(\d{1,2})$/g;var arrDate = [];str.replace(reg1, function() {    // arrDate = [].slice.call(arguments);    arrDate = Array.from(arguments);    arrDate = arrDate.slice(1, 7);});// console.log(arrDate);// var arrDate = ['2017', '6', '7', '23', '43', '12'];var reg = /{(\d)}/g;resStr = resStr.replace(reg, function($0, $1) {    var num = arrDate[$1];    return num < 10 ? '0' + num : num;});console.log(resStr); // 2017年06月07日  23时:43分12秒

千分符

分组先后出现的判断:从左向右,谁先出现就是靠前分组

方法1:

var str = '9335673817'; // 9,335,673,817var reg = /^(\d{1,3})((?:\d{3})+)$/g;var t = str.replace(reg, function() {  var result1 = arguments[1];  var reslut2 = arguments[2];  return result1 + ',' + reslut2.replace(/\d{3}(?!$)/g, function() { // 负向欲查    return arguments[0] + ',';  });});

方法2:

// 倒着数// 9,335,673,817 // 10 - 7 - 1// 如果字符串的长度 - 索引本身位置 - 1 模 3 == 0 ,则在这个字符串的后边加一个','// 在数值的前方加,第一个字符串有需要再次处理。// 在数值的后方加,就可以。var str = '9335673817'; // 9,335,673,817var reg = /\d(?!$)/g;  // (?!$) 不去捕获最后一位var str = str.replace(reg, function(r, i){  if ((str.length - i - 1) % 3 == 0) {    return r + ',';  } else {    return r;  }});console.log(str);

方法3:

// 倒序处理str = str.split('').reverse().join('');str = str.replace(/(\d{3}(?!$))/g, '$1,');str = str.split('').reverse().join('');

欲查

  • re从文本头部到尾部开始解析。文本尾部方向叫做“前”,也就是往前走,另一方向就是后。
  • 前瞻就是re匹配规则的时候,先向前看看,是否符合断言规则。后瞻/后顾的规则相反(JS不支持后顾)

/^$/ 表示严格匹配,以什么开头,以什么结尾,只能在这里边

问号?总结:

// 在正则中,把 `?`的用法和`()`的用法掌握好// 正则中的断言/*(?=exp)  (本身不占宽度,肯定的,向前看)(?!exp)(?<=exp)(?

欲查

特点:

  1. 不消耗字符
  2. 修饰左边元字符
  3. 检测任意元字符,任意位数

欲查修饰左边,如果前面没有修饰空表达式,空正则.

(?!exp) Zero-width positive lookahead(本身不占宽度,肯定的,向前看)

正则中的断言Assert 前提, 前提条件

var str = '13456789';var reg = /(\d)(?=(?:\d{3})+$)/g; // $ 匹配到结尾str = str.replace(reg, function() {  // console.log(arguments);  return arguments[0] + ',';}).replace(reg, '$1,');console.log(str);

转载地址:http://vhkwa.baihongyu.com/

你可能感兴趣的文章
POJ1465:Multiple(BFS)
查看>>
使用框架页面的跳转 转
查看>>
php lock_sh共享锁 与 lock_ex排他锁
查看>>
codeigniter 对数据库的常用操作
查看>>
重装win7系统多个方法介绍
查看>>
Python之路
查看>>
IOS 消息推送---服务端.p12证书的生成
查看>>
mysql中将一个数据类型转换成另外的数据类型?mysql中cast函数的使用?
查看>>
URI URL URN
查看>>
获取当前进程的寄存器内容
查看>>
HDU 3642 Get The Treasury (线段树扫描线)
查看>>
AWK
查看>>
alpha 10
查看>>
C++中线程使用与参数传递
查看>>
VirtualBox中安装CentOS(新手教程)
查看>>
HTTP 请求头中的 X-Forwarded-For,X-Real-IP
查看>>
SDUT OJ 数据结构上机测试1:顺序表的应用
查看>>
d3----line_color_gradient 学习记录
查看>>
矩阵运算 【微软面试100题 第四十五题】
查看>>
E: Sub-process /usr/bin/dpkg returned an error code (1)
查看>>