天天爱天天做天天享受,欧美成人黑人视频免费观看

主頁 > 知識庫 > 正則表達(dá)式教程之位置匹配詳解

正則表達(dá)式教程之位置匹配詳解

本文實(shí)例講述了正則表達(dá)式教程之位置匹配。分享給大家供大家參考，具體如下：

注：在所有例子中正則表達(dá)式匹配結(jié)果包含在源文本中的【和】之間，有的例子會(huì)使用Java來實(shí)現(xiàn)，如果是java本身正則表達(dá)式的用法，會(huì)在相應(yīng)的地方說明。所有java例子都在JDK1.6.0_13下測試通過。

一、問題引入

如果想匹配一段文本中的某個(gè)單詞（暫不考慮多行模式，將在后面介紹），我們可能會(huì)像下面這樣：

文本：Yesterday is history, tomorrow is a mystery, but today is a gift.

正則表達(dá)式：is

結(jié)果：Yesterday 【is】 h【is】tory, tomorrow 【is】 a mystery, but today 【is】 a gift.

分析：本來只是要匹配單詞is，但把其他單詞中包含的is也匹配出來了。要解決這個(gè)問題，使用邊界界定符，也就是在正則表達(dá)式里用一些元字符來表明我們想讓匹配操作在什么位置（或邊界）發(fā)生。

二、單詞邊界

一種常用的邊界是由限定符\b指定的單詞邊界，\b用來匹配單詞的開始和結(jié)尾。更確切地說，它是匹配這樣一個(gè)位置，這個(gè)位置位于一個(gè)能夠用來構(gòu)成單詞的字符（字母、數(shù)字、下劃線，也就是與\w相匹配的字符）和一個(gè)不能用來構(gòu)成單詞的字符（與\W相匹配的字符）之間。來看前面的例子：

文本：Yesterday is history, tomorrow is a mystery, but today is a gift.

正則表達(dá)式：\bis\b

結(jié)果：Yesterday 【is】 history, tomorrow 【is】 a mystery, but today 【is】 a gift.

分析：在原始文本中，單詞is的前后都有一個(gè)空格，而這與模式\bis\b匹配（空格是用來分隔單詞的字符之一）。而單詞history中也包含了is，因?yàn)樗那昂蠓謩e有一個(gè)字符h和t，這兩個(gè)字符都不能與\b匹配。

如果不匹配一個(gè)單詞邊界，則使用\B。如：

文本：Please enter the nine-digit id as it appears on your color - coded pass-key.

正則表達(dá)式：\B-\B

結(jié)果：Please enter the 【nine-digit】 id as it appears on your color - coded 【pass-key】.

分析：\B-\B將匹配一個(gè)前后都不是單詞邊界的連字符，nine-digit和pass-key中連字符前后都沒有空格，所以能夠匹配，而color - coded中連字符前后都有空格，所以不能匹配。

三、字符串邊界

單詞邊界可以用來進(jìn)行與單詞有關(guān)的位置匹配（單詞開頭、結(jié)束、整個(gè)單詞等等）。而字符串邊界也有著類似的用途，只不過是用來進(jìn)行與字符串有關(guān)的位置匹配（字符串開頭、結(jié)束、整個(gè)字符串等等）。用來定義字符串邊界的元字符有兩個(gè)：一個(gè)是用來定義字符串開頭的^，另一個(gè)是用來定義字符串結(jié)尾的$。

比如要檢查一個(gè)XML文檔的合法性，合法的XML文檔都以?xml…..?>這樣形式開頭：

文本：

?xml version="1.0" encoding="UTF-8"?>
project basedir="." default="ear">
/project>

正則表達(dá)式：^\s*\&;xml.*?\&;>

結(jié)果：

?xml version="1.0" encoding="UTF-8"?>
project basedir="." default="ear">
/project>

分析：^匹配一個(gè)字符串的開頭位置，所以^\s*將匹配一個(gè)字符串的開頭位置和隨后的零個(gè)或多個(gè)空白字符，因?yàn)?#63;xml>標(biāo)簽前面允許有空格、制表符、換行符等空白字符。

$元字符符的用法除了位置上的差異外，與^用法完全一樣。比如，檢查一個(gè)html頁面是否以/html>結(jié)尾，可以用模式：/[Hh][Tt][Mm][Ll]>\s*$

四、多行匹配模式

正則表達(dá)式可以通過一些特殊的元字符來改變另外一些元字符的行為。可以通過(?m) 來啟用多行匹配模式。多行匹配模式將使得正則表達(dá)式引擎把行分隔符當(dāng)做一個(gè)字符串分隔符來對待。在多行匹配模式下，^不僅匹配正常的字符串開頭，還將匹配行分隔符（換行符）后面的開始位置，$不僅匹配正常的字符串結(jié)尾，還將匹配行分隔符（換行符）后面的結(jié)束位置。

在使用時(shí)，(?m)必須出現(xiàn)在整個(gè)模式的最前面。比如，通過正則表達(dá)式把一段java代碼中的單行注釋（以//開始）內(nèi)容全部找出來。

文本：

publicDownloadingDialog(Frame parent){
     //Callsuper constructor, specifying that dialog box is modal.
     super(parent,true);
     //Setdialog box title.
     setTitle("E-mailClient");
     //Instructwindow not to close when the "X" is clicked.
     setDefaultCloseOperation(DO_NOTHING_ON_CLOSE);
     //Puta message with a nice border in this dialog box.
     JPanelcontentPanel = new JPanel();
     contentPanel.setBorder(BorderFactory.createEmptyBorder(5,5, 5, 5));
     contentPanel.add(newJLabel("Downloading messages..."));
     setContentPane(contentPanel);
     //Sizedialog box to components.
     pack();
     //Centerdialog box over application.
     setLocationRelativeTo(parent);
}

正則表達(dá)式：(?m)^\s*//.*$

結(jié)果：

         publicDownloadingDialog(Frame parent){
【              //Call superconstructor, specifying that dialog box is modal.】
                   super(parent,true);
【              //Set dialog boxtitle.】
                   setTitle("E-mailClient");
【              //Instruct windownot to close when the "X" is clicked.】
                   setDefaultCloseOperation(DO_NOTHING_ON_CLOSE);
【              //Put a messagewith a nice border in this dialog box.】
                   JPanelcontentPanel = new JPanel();
                   contentPanel.setBorder(BorderFactory.createEmptyBorder(5,5, 5, 5));
                   contentPanel.add(newJLabel("Downloading messages..."));
                   setContentPane(contentPanel);
【              //Size dialog boxto components.】
                   pack();
【              //Center dialogbox over application.】
                   setLocationRelativeTo(parent);
         }

分析：^\s*//.*$將匹配一個(gè)字符串的開始，然后是任意多個(gè)空白字符，再后面是//，再往后是任意文本，最后是一個(gè)字符串的結(jié)束。不過這個(gè)模式只能找出第一條注釋，加上(?m)前綴后，將把換行符視為一個(gè)字符串分隔符，這樣就可以把每一行注釋匹配出來了。

java代碼實(shí)現(xiàn)如下（文本保存在text.txt文件中）：

public static String getTextFromFile(String path) throws Exception{
  BufferedReader br = new BufferedReader(new FileReader(new File(path)));
  StringBuilder sb = new StringBuilder();
  char[] cbuf = new char[1024];
  int len = 0;
  while(br.ready()  (len = br.read(cbuf)) > 0){
    br.read(cbuf);
    sb.append(cbuf, 0, len);
  }
    br.close();
  return sb.toString();
}
public static void multilineMatch() throws Exception{
  String text = getTextFromFile("E:/text.txt");
  String regex = "(?m)^\\s*//.*$";
  Matcher m = Pattern.compile(regex).matcher(text);
  while(m.find()){
    System.out.println(m.group());
  }
}

輸出結(jié)果如下：

//Call super constructor, specifying that dialog box is modal.
//Set dialog box title.
//Instruct window not to close when the "X" is clicked.
//Put a message with a nice border in this dialog box.
//Size dialog box to components.
//Center dialog box over application.

五、小結(jié)

正則表達(dá)式不僅可以用來匹配任意長度的文本塊，還可以用來匹配出現(xiàn)在字符串中特定位置的文本。\b用來指定一個(gè)單詞邊界（\B剛好相反）。^和$用來指定單詞邊界。如果與(?m)配合使用，^和$還將匹配在一個(gè)換行符處開頭或結(jié)尾的字符串。在接下來的文章中將介紹子表達(dá)式的使用。

PS：這里再為大家提供2款非常方便的正則表達(dá)式工具供大家參考使用：

JavaScript正則表達(dá)式在線測試工具：
http://tools.jb51.net/regex/javascript

正則表達(dá)式在線生成工具：
http://tools.jb51.net/regex/create_reg

希望本文所述對大家正則表達(dá)式學(xué)習(xí)有所幫助。

您可能感興趣的文章:

正則表達(dá)式匹配用戶密碼
Javascript校驗(yàn)密碼復(fù)雜度的正則表達(dá)式
手機(jī)號碼，密碼正則驗(yàn)證
php password密碼驗(yàn)證正則表達(dá)式(8位長度限制)
js正則實(shí)現(xiàn)的密碼框簡單制作,還可以替換成自己想用得符號
密碼強(qiáng)度檢測函數(shù)（正則）
正則表達(dá)式教程之重復(fù)匹配詳解
正則表達(dá)式教程之匹配一組字符詳解
正則表達(dá)式教程之匹配單個(gè)字符詳解
JS正則匹配中文的方法示例
正則匹配密碼只能是數(shù)字和字母組合字符串功能【php與js實(shí)現(xiàn)】

標(biāo)簽：湖州涼山泰安 ?？?/a> 本溪常州哈密大興安嶺

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《正則表達(dá)式教程之位置匹配詳解》，本文關(guān)鍵詞正則,表達(dá)式,教程,之,位置,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。