#pattern-matching #wildcard #string-matching #string-pattern #pattern #specification #expression

bin+lib wildcard_ex

This is a library for extended wildcards that allows VB-like specifications

3 releases

0.1.2 Jul 25, 2024
0.1.1 Jul 25, 2024
0.1.0 Jul 25, 2024

#720 in Text processing

46 downloads per month

Custom license

46KB
857 lines

wildcard_ex for Rust

This is a library for extended wildcards that allows VB-like specifications. It enables the expression of repeating arbitrary strings with simple specifications using wildcards.

Install the crate

To install the crate, run the following command.

cargo add wildcard_ex

Example - Basic usage

You just need to call the is_match(pattern, str) function as shown below.

use wildcard_ex::{is_match, ex};
fn main() {
    // match with wildcard characters ['*', '?', '#', "[...]"]
    assert_eq!(is_match("*.txt", "abc.txt"), true);
    assert_eq!(is_match("test*.txt", "test1234.txt"), true);
    // using Pattern object
    let pattern = ex::Pattern::new("*.txt");
    assert_eq!(pattern.is_match("abc.txt"), true);
    assert_eq!(pattern.is_match("abc.zip"), false);
}

Various pattern matching examples

Pattern matching can be performed by specifying wildcard patterns as shown below.

use wildcard_ex::{is_match_simple, is_match};
fn main() {
    // simple pattern matching with wildcard characters ['*', '?', '#']
    assert_eq!(is_match_simple("*.txt", "abc.txt"), true);
    assert_eq!(is_match_simple("a???.txt", "abcd.txt"), true);
    assert_eq!(is_match_simple("zip:###-####", "zip:111-2222"), true); // '#' is number
    // wildcard "[...]"
    assert_eq!(is_match("[a-z]1234.txt", "a1234.txt"), true);
    assert_eq!(is_match("[a-z][0-9].txt", "b5.txt"), true);
    // not pattern
    assert_eq!(is_match("[!0-9][0-9].txt", "c9.txt"), true);
    // repeating pattern
    assert_eq!(is_match("[+0-9].txt", "12345.txt"), true);
    assert_eq!(is_match("[+a-z0-9].txt", "abc12345.txt"), true);
    // selector
    assert_eq!(is_match("[=cat|dog].txt", "cat.txt"), true);
}
  • is_match_simple specifies general wildcards.
  • is_match specifies extended wildcards.

Wildcard patterns

The supported patterns are as follows in the table below.

Pattern Description
* Any character repeated 0 or more times
? Any single character
# Any single digit (=[0-9])
\ Escape character. '\t' means tab, '\n' means newline, '[' means '['
[str] Any single character from the specified string str
[!str] Any single character except those in the specified string str
[+str] Any character from the specified string str repeated 1 or more times
[-str] Any character except those in the specified string str repeated 1 or more times
[=aaa|bbb] The string aaa or bbb
  • In [str], you can specify character codes using \xHH or \uHHHH.

Extract matched part from beginning

use wildcard_ex::*;
fn main() {
    assert_eq!(extract_match("*.txt", "abc.txt"), Some("abc.txt".to_string()));
    assert_eq!(extract_match("hello*", "hello, world!"), Some("hello, world!".to_string()));
}

(ja) 拡張ワイルドカード

このクレートは、VBライクな指定が可能な拡張ワイルドカードのライブラリです。 簡単な指定でワイルドカードの任意文字列の繰り返し表現が可能です。 日本語などのマルチバイト文字列も問題なく処理できます。

指定可能なのは次のようなワイルドカードのパターンです。

パターン 説明
* 任意の文字が0回以上繰り返される
? 任意の1文字
# 任意の1桁の数字 (=[0-\9])
\ エスケープ文字。'\t'はタブ、'\n'は改行、'\['は'['を意味する
[str] 指定された文字列strのいずれか1文字
[!str] 指定された文字列str以外のいずれか1文字
[+str] 指定された文字列strの任意の文字が1回以上繰り返される
[-str] 指定された文字列str以外の文字が1回以上繰り返される
[=aaa|bbb] 文字列aaaまたはbbb
  • [str]では、\xHHあるいは\uHHHHを指定して文字コードを指定できます。

簡単な使い方

  • is_match_simpleは一般的なワイルドカードを指定するものです。
  • is_matchは拡張ワイルドカードを指定するものです。
use wildcard_ex::{is_match_simple, is_match};
fn main() {
    // simple pattern matching with wildcard characters ['*', '?', '#']
    assert_eq!(is_match_simple("*.txt", "abc.txt"), true);
    assert_eq!(is_match_simple("a???.txt", "abcd.txt"), true);
    assert_eq!(is_match_simple("zip:###-####", "zip:111-2222"), true); // '#' is number
    // wildcard "[...]"
    assert_eq!(is_match("[a-z]1234.txt", "a1234.txt"), true);
    assert_eq!(is_match("[a-z][0-9].txt", "b5.txt"), true);
    // not pattern
    assert_eq!(is_match("[!0-9][0-9].txt", "c9.txt"), true);
    // repeating pattern
    assert_eq!(is_match("[+0-9].txt", "12345.txt"), true);
    assert_eq!(is_match("[+a-z0-9].txt", "abc12345.txt"), true);
    // selector
    assert_eq!(is_match("[=cat|dog].txt", "cat.txt"), true);
}

No runtime deps