# 正規表示咒語詠唱術
[測試網頁](https://regex101.com/)
## 原文無字天書
```
Aug 9 02:36:29 192.168.12.34 CEF: 0|Acalvio|ShadowPlex|2022.5.4.0|16|"Vulnerability Exploited"|10|customer_id=yusawa customer_display_name=yusawaTech cat="Vulnerability Exploited" subCat="Intrusion Detected" sev=10 externalId=https://192.168.12.34/#/siem/incident/details?jobID=01d7db94-84a0-45f7-9457-d2f6fb8d4a53 start="Aug 09 2022 02:33:42.000 UTC" rt="Aug 09 2022 02:33:42.000 UTC" cs2Label=subnet cs2=192.168.12.0/24 src=192.168.12.208 dst=192.168.12.240 dhost=DESKTOP-181 dpt=445 app=microsoft-ds dmac=98:90:96:50:e1:d8 cs6Label=Intrusion_method_used cs6="OS-WINDOWS Microsoft Windows SMB large NT RENAME transaction request memory leak attempt" cs37Label=domain cs37=IT
```
## 咒語語法簡解
[欄位來源](https://atedev.wordpress.com/2007/11/23/%E6%AD%A3%E8%A6%8F%E8%A1%A8%E7%A4%BA%E5%BC%8F-regular-expression/)
| 正規表示式 | 說明及範例 | 比對不成立之字串 |
| ------------- | ------------------------------------------------------------ | ------------------------ |
| `a` | 含字母 “a” 的字串,例如 “ab”, “bac”, “cba” | “xyz” |
| `a.` | 含字母 “a” 以及其後任一個字元的字串,例如 “ab”, “bac”(若要比對`.`,請使用 `\.`) | “a”, “ba” |
| `^xy` | 以 “xy” 開始的字串,例如 “xyz”, “xyab”(若要比對 `^`,請使用 `\^`) | “axy”, “bxy” |
| `xy$` | 以 “xy” 結尾的字串,例如 “axy”, “abxy” (若要比對 `$`,請使用 `\$`) | “xya”, “xyb” |
| `[13579]` | 包含 “1” 或 “3” 或 “5” 或 “7” 或 “9” 的字串,例如:”a3b”, “1xy” | “y2k” |
| `[0-9]` | 含數字之字串 | 不含數字之字串 |
| `[a-z0-9]` | 含數字或小寫字母之字串 | 不含數字及小寫字母之字串 |
| `[a-zA-Z0-9]` | 含數字或字母之字串 | 不含數字及字母之字串 |
| `b[aeiou]t` | “bat”, “bet”, “bit”, “bot”, “but” | “bxt”, “bzt” |
| `[^0-9]` | 不含數字之字串(若要比對 ^,請使用 `\^`) | 含數字之字串 |
| `[^aeiouAEIOU]` | 不含母音之字串(若要比對 ^,請使用 `\^`) | 含母音之字串 |
| `[^\^]` | 不含 “^” 之字串,例如 “xyz”, “abc” | “xy^”, “a^bc” |
| 正規表示式的特定字元 | 說明 | 等效的正規表示式 |
| -------------------- | ---------------- | ---------------- |
| `\d` | 數字 | [0-9] |
| `\D` | 非數字 | [^0-9] |
| `\w` | 數字、字母、底線 | [a-zA-Z0-9_] |
| `\W` | 非數字、字母、底線 | [^a-zA-Z0-9_] |
| `\s` | 空白字元 | [\r\t\n\f] |
| `\S` | 非空白字元 | [^\r\t\n\f] |
| 正規表示式 | 說明 |
| ---------- | --------------------------------------- |
| `a?` | 零或一個 a(若要比對? 字元,請使用 `\?`) |
| `a+` | 一或多個 a(若要比對+ 字元,請使用 `\+`) |
| `a*` | 零或多個 a(若要比對* 字元,請使用 `\*`) |
| `a{4}` | 四個 a |
| `a{5,10}` | 五至十個 a |
| `a{5,}` | 至少五個 a |
| `a{,3}` | 至多三個 a |
| `a.{5}b` | a 和 b中間夾五個(非換行)字元 |
| 字元 | 說明 | 簡單範例 |
| --------- | ------------------------------------------------------------ | ------------------------------------------------------------ |
| `\` | 避開特殊字元 | `A\*` 可用於比對 “A*”,其中 * 是一個特殊字元,為避開其特殊意義,所以必須加上 “\” |
| `^`| 比對輸入列的啟始位置 | `^A` 可比對 “Abcd” 中的 “A”,但不可比對 “aAb” |
| `$` | 比對輸入列的結束位置 | `A$` 可比對 “bcdA” 中的 “A”,但不可比對 “aAb” |
| `*` | 比對前一個字元零次或更多次 | `bo*` 可比對 “Good boook” 中的 “booo”,亦可比對 “Good bk” 中的 “b” |
| `+` | 比對前一個字元一次或更多次,等效於 {1,} | `a+` 可比對 “caaandy” 中的 “aaa”,但不可比對 “cndy” |
| `?` | 比對前一個字元零次或一次 | `e?l` 可比對 “angel” 中的 “el”,也可以比對 “angle” 中的 “l” |
| `.` | 比對任何一個字元(但換行符號不算) | `.n` 可比對 “nay, an apple is on the tree” 中的 “an” 和 “on”,但不可比對 “nay” |
| `(x)` | 比對 x 並將符合的部分存入一個變數 | `(a*) and (b*)` 可比對 “aaa and bb” 中的 “aaa” 和 “bb”,並將這兩個比對得到的字串設定至變數 RegExp.$1 和 RegExp.$2。 |
| `xy` | 比對 x 或 y | `a*b*/g` 可比對 “aaa and bb” 中的 “aaa” 和 “bb” |
| `{n}` | 比對前一個字元 n 次,n 為一個正整數 | `a{3}` 可比對 “lllaaalaa” 其中的 “aaa”,但不可比對 “aa” |
| `{n,}` | 比對前一個字元至少 n 次,n 為一個正整數 | `a{3,}` 可比對 “aa aaa aaaa” 其中的 “aaa” 及 “aaaa”,但不可比對 “aa” |
| `{n,m}` | 比對前一個字元至少 n 次,至多 m 次,m、n 均為正整數 | `a{3,4}` 可比對 “aa aaa aaaa aaaaa” 其中的 “aaa” 及 “aaaa”,但不可比對 “aa” 及 “aaaaa” |
| `[xyz]` | 比對中括弧內的任一個字元 | `[ecm]` 可比對 “welcome” 中的 “e” 或 “c” 或 “m” |
| `[^xyz]` | 比對不在中括弧內出現的任一個字元 | `[^ecm]` 可比對 “welcome” 中的 “w”、”l”、”o”,可見出其與 [xyz] 功能相反。(同時請注意 /^/ 與 [^] 之間功能的不同。) |
| `[\b]` | 比對退位字元(Backspace character) | 可以比對一個 backspace ,也請注意 [\b] 與 \b 之間的差別 |
| `\b` | 比對英文字的邊界,例如空格 | 例如 `\bn\w` 可以比對 “noonday” 中的 ‘no’ ; `\wy\b` 可比對 “possibly yesterday.” 中的 ‘ly’ |
| `\B` | 比對非「英文字的邊界」 | 例如, `\w\Bn` 可以比對 “noonday” 中的 ‘on’ , 另外 `y\B\w` 可以比對 “possibly yesterday.” 中的 ‘ye’ |
| `\cX` | 比對控制字元(Control character),其中 X 是一個控制字元 | `\cM` 可以比對 一個字串中的 control-M |
| `\d` | 比對任一個數字,等效於 [0-9] | `[\d]`可比對 由 “0” 至 “9” 的任一數字 但其餘如字母等就不可比對 |
| `\D` | 比對任一個非數字,等效於 [^0-9] | `[\D]` 可比對 “w” “a”… 但不可比對如 “7” “1” 等數字 |
| `\f` | 比對 form-feed | 若是在文字中有發生 “換頁” 的行為 則可以比對成功 |
| `\n` | 比對換行符號 | 若是在文字中有發生 “換行” 的行為 則可以比對成功 |
| `\r` | 比對 carriage return | |
| `\s` | 比對任一個空白字元(White space character),等效於 [\f\n\r\t\v] | `\s\w*` 可比對 “A b” 中的 “b” |
| `\S` | 比對任一個非空白字元,等效於 [^\f\n\r\t\v] | `\S\w*` 可比對 “A b” 中的 “A” |
| `\t` | 比對定位字元(Tab) | |
| `\v` | 比對垂直定位字元(Vertical tab) | |
| `\w` | 比對數字字母字元(Alphanumerical characters)或底線字母`(”_”)`,等效於 [A-Za-z0-9_] | `\w` 可比對 `.A _!9` 中的 `A`、`_`、`9`。 |
| `\W` | 比對非「數字字母字元或底線字母」,等效於 [^A-Za-z0-9_] | `\W` 可比對 `.A _!9` 中的 `.`、` `、`!`,可見其功能與 `\w` 恰好相反。 |
| `\ooctal` | 比對八進位,其中octal是八進位數目 | `\oocetal123` 可比對 與 八進位的ASCII中 “123” 所相對應的字元值。 |
| `\xhex` | 比對十六進位,其中hex是十六進位數目 | `\xhex38` 可比對 與 16進位的ASCII中 “38” 所相對應的字元。 |
## 咒語語法詳解
### 欄位標題
| 語法 | 用途| 範例 |
| -------- | -------- | -------- |
| `(?P<str>)` | 為欄位取名 | `(?P<Mon>)`|
使用方式為`(?P<欄位名稱>)`,他就會幫欄位取名,但不能用中文

---
### 正規表示式
| 語法 | 說明及範例 | 比對不成立的字元 |
| -------- | -------- | -------- |
| `a` | 含字母 “a” 的字元,例如 “ab”, “bac”, “cba” | `zxc` |

---
| 語法 | 說明及範例 | 比對不成立的字元 |
| -------- | -------- | -------- |
| `[13579]` | 包含 “1” 或 “3” 或 “5” 或 “7” 或 “9” 的字串,例如:”a3b”, “1xy” | “y2k” |
| `[0-9]` | 含數字之字串 | 不含數字之字串 |
| `[a-z]` | 含小寫字母之字串 | 不含小寫字母之字串 |
| `[A-Z]` | 含大寫字母之字串 | 不含大寫字母之字串 |
| `b[aeiou]t` | “bat”, “bet”, “bit”, “bot”, “but” | “bxt”, “bzt” |
| `[^0-9]` | 不含數字之字串(若要比對 ^,請使用 `\^`) | 含數字之字串 |
| `[^aeiouAEIOU]` | 不含母音之字串(若要比對 ^,請使用`\^`)| 含母音之字串 |
| `[^\^]` | 不含 “^” 之字串,例如 “xyz”, “abc” | “xy^”, “a^bc” |


也可以自訂數字範圍,比如`[2-9]`,他就不會去匹配0、1



這種匹配法都可混用,也可自訂要抓的範圍或文字

---
### 正規表示式的特定字元
| 語法 | 用途 | 等效的正規表示式 | 範例 |
| -------- | -------- | -------- | -------- |
| `\S` | 比對所有非空白字元 | `[^\r\t\n\f]` | `(?P<Mon>\S)`|
| `\s` | 比對所有空白字元 | `[\r\t\n\f]` | `(?P<Mon>\s)`|


---
| 語法 | 用途| 等效的正規表示式 | 範例 |
| -------- | -------- | -------- | -------- |
| `\W` | 比對所有非數字、字母、底線,就是=、+、/這些特殊符號 | `[^a-zA-Z0-9_]` | `(?P<Mon>\W)`|
| `\w` | 比對所有數字、字母、底線 | `[a-zA-Z0-9_]` | `(?P<Mon>\w)`|


---
| 語法 | 用途| 等效的正規表示式 | 範例 |
| -------- | -------- | -------- | -------- |
| `\D` | 比對所有非數字 | `[^0-9]` | `(?P<Mon>\D)`|
| `\d` | 比對所有數字 | `[^0-9]` | `(?P<Mon>\d)`|


---
### 特殊符號
| 語法 | 說明 | 範例 |
| -------- | -------- | -------- |
| `*` | 比對前面零或多個字元 | `(?P<Mon>\S*)`|
加了`*`才會選擇完整的字串,不然他會把字個別分開
這裡用/S來抓非空白的字元

有星號的欄位

沒星號的欄位

可直接比對所需字元
這邊給`Au*`,他會比對文內所有含Au及u前的字元,所以會抓到A

---
| 語法 | 說明 | 範例 |
| -------- | -------- | -------- |
| `+` | 比對前一個字元一次或更多次,等效於 {1,} | `(?P<Mon>\S+)`|
跟`*`使用起來差不多

但如果用`+`的話,他不會跟`*`一樣去對其他地方的單字元做比對

---
| 語法 | 說明 | 範例 |
| -------- | -------- | -------- |
| `?` | 比對前一個字元零次或一次 | `(?P<Mon>Au?)`|
>`?`表示放在其他字符後面表示前面的字符可以有,也可以沒有,或者放在`*`、`+`後面表示匹配盡可能少的字符
>例如:字符串fooooo,正則來`fo*`和`fo+`會匹配整個字符串,`fo+?` 匹配fo,`fo*?`匹配f
跟`*`差不多的用法,但可以做搭配

使用`*?`代表匹配u前的A字元,不會匹配到u

使用`+?`代表匹配Au字元

---
| 語法 | 範例 | 說明 | 比對不成立的字元 |
| -------- | -------- | -------- | -------- |
| `.` | `a.` | 含字母 “a” 以及其後任一個字元的字串,例如 “ab”, “bac”(若要比對.,請使用 `\.`) | `a`, `ba` |

可以透過`{數字}`來指定要抓`a`後多少個字元
如圖範例就是`a+後3`個字元

---
| 語法 | 範例 | 說明 | 比對不成立的字元 |
| -------- | -------- | -------- | -------- |
| `^` | `^xy` | 以 “xy” 開始的字串,例如 “xyz”, “xyab”(若要比對^,請使用 `\^`) | `axy` , `bxy` |
只抓Au開始的字元,像最後一行asdAu的Au在後面,就不列入抓取範圍

---
| 語法 | 範例 | 說明 | 比對不成立的字元 |
| -------- | -------- | -------- | -------- |
| `$` | `xy$` | 以 “xy” 結尾的字串,例如 “axy”, “abxy” (若要比對`$`,請使用 `\$`) | `xya` , `xyb` |
只抓IT結尾的字元,像其他行的IT在前面或中間,就不列入抓取範圍

---
| 語法 | 說明 | 範例 |
| -------- | -------- | -------- |
| `a{n}` | 比對前一個字元 n 次 | `(?P<Mon>w.{5}` |
| `a{n,m}` | 比對前一個字元至少 n 次,至多 m 次 | `(?P<Mon>w.{1,10}` |
| `a{n,}` | 比對前一個字元至少 n 次 | `(?P<Mon>w{5,})` |
| `a{,m}` | 比對前一個字元至多 m 次 | |
| `a.{n}b` | a 和 b中間夾 n 個(非換行)字元 | `(?P<Mon>w.{5}t` |
匹配w後+5個字元

匹配w後1到10個字元

匹配超過5個w字元的字串

匹配w到t之間有5個字元的地方,如果超過或不到就不匹配

---
## 咒術詠唱
```
(?P<date>\w{3}\s+\d+\s+\S+)\s+(?P<IP>\S+)\s+\S+\s\d+\|(?P<aaa>[^|]*)\|(?P<bbb>[^|]*)\|(?P<ccc>[^|]*)\|(?P<ddd>[^|]*)\|\"\w[^=]*=(?P<customer_id>\S+)\s\w[^=]*=(?P<customer_display_name>\S+)\s.*externalId=(?P<externalId>[^\s]*)\s+\w*\=\"(?P<start>\w{3}\s+\d+\s+\d+\s\S+\s\w+)\"\s.*src=(?P<src>\S*)\s+dst=(?P<dst>\S*)\s.*dpt=(?P<dpt>\S*)\s+.*
```

