2015年5月25日

Javascript正则表达式笔记

由于最近项目需要从字符串中提取字串,具体地说是匹配实数集R(严格的说是有理数集Q)中的元素。网上找了一圈没一个能用的,不知道是不是我使用正则表达式的方法有问题。而且网上似乎转来转去的都是那么几篇文章,无奈只能自己来写。

由于不能预见字串会有几位小数,正负也不一定,所以下面的正则表达式匹配的是一切实数(严格的说是有理数):

var str1 = "transform(-332.44,567)";
var str2 = "transform(0,-42)";

var regExp = str1.match("/0|-?\d+[.]?\d+/g");     // regExp=[-332.44, 567]
regExp = str2.match("/0|-?\d+[.]?\d+/g");       // regExp=[0, -42]

看到几乎所有的文章都只记录了表达式,而没有告诉读者表达式是如何写出来的,读者往往只能知其然而不知其所以然。这里再说一下这个正则表达式书写的过程。其实只要根据实数(严格的说是有理数)的判据就容易得到:

  • 0
  • 可能有一个负号(负数),或者没有(正数)
  • 可能有一个小数点(小数),或者没有(整数)

所以,表达式中,第一部分将0提出来,单独作为一个可能即“0|”;第二部分,即整数部分,为1~n位数字,即”[0-9]{1,}“,可简写为“[0-9]+”,进而继续简写为“\d+”;第三部分,即小数点,可能存在也可能不存在,故写为“[.]?”;小数部分同整数部分;最后,再加上js的正则表达式搜索指令g表示是一个贪心模式,即可匹配出全部的数字。