当前位置:   article > 正文

【FFH】OpenHarmony——ArkTs应用开发+正则表达式_arkts 正则表达式

arkts 正则表达式

【FFH】OpenHarmony——ArkTs应用开发+正则表达式

1. 前言——系列介绍

本系列文章主要是记录笔者在鸿蒙领域的学习与工作中的知识点笔记记录,其中不止会针对鸿蒙中的学习问题进行思考与记录,也会对涉及到的一些嵌入式等其他领域进行记录。

目前该系列已发布的内容有:

  1. 【FFH】开源鸿蒙南向嵌入学习笔记——NAPI框架学习(一)-开源基础软件社区-51CTO.COM

2. 本文摘要及背景

2.1 摘要

  1. 本文最核心❇️ :在做(开源)鸿蒙应用开发时,ArkTs中使用正则表达式处理像string等字符串对象。
  2. 介绍一些ArkTs使用正则表达式示例,以及一些可能比较常用的小技巧✴️ 。
  3. 介绍正则表达式的一些应用技巧,涉及到匹配模式
  4. 正则表达式在开源鸿蒙应用开发中,可以起到怎样的一个应用。

2.2 背景

  1. 黄同学最近在做OpenHarmony 应用开发的时候,遇到了一些场景,我需要从像string 这样的字符串数据中,获取我需要的特定信息。
  2. 传统的解决方式:相信我的读者可能都有一些DS的基础,知道这种其实就是字符串匹配问题,针对这种问题,常见的解法是使用:暴力匹配KMPAC自动机等方式,但是在实际应用当中如果这样做,可能比较蠢。
  3. 黄同学此前有过在Python中使用过具有正则表达(式)匹配功能的 re 模块的经历。但是ArkTs 并没有类似的集成API。但是在ArkTs 的相关文档以及文章中,对这一块的描述都比较少。但是从官方的描述来看,我们可以知道 ArkTs 是 TypeScriptJavaScript超集,兼容了JS/TS的语言生态。所以黄同学在写这篇文章的时候,看了不少JS和TS关于正则表达式的使用的文档。

2.3 MindMap

在这里插入图片描述

3. 正则表达式在ArkTs的使用

3.1 变量 RegExp

  1. ArkTs 中,正则表达式的变量类型是RegExp,这一点基本上兼容了JS。

  2. 有两种表达方式

    1. 可以用斜杠来包住正则表达式,里边就是正则表达式的内容。

      let rep: RegExp = /a\S+b/;
      
      • 1
    2. 也可以用RegExp的构造函数来构造,需要传入string作为参数

      let rep = new RegExp("a\S+b");
      
      • 1

3.2 使用

正则表达式的变量使用较多,主要有:

  1. match,这个是黄同学使用的最多的,在字符串中执行查找匹配的string方法,会返回一个数组。

    let rep: RegExp = /acfun1+/;
    let s: string = "bkacfun1112";
    console.log(s.match(rep)[0]);			// acfun111
    
    • 1
    • 2
    • 3
  2. test,在一个字符串中测试,判断正则表达式是否能够和字符串匹配

let rep: RegExp = /acfun1+/;
let s: string = "bkacfun1112";
console.log('' + rep.test(string) ? 'yes' : 'no');			// yes
  • 1
  • 2
  • 3
  1. match 查到的是一个第一个,但如果想匹配所有符合正则表达式的,可以使用 matchAll,这个返回的是一个迭代器 ⚛️,这个就不给出用例了,感兴趣的朋友可以自行去js 的相关文档,或者看看我的参考资料23。下面也一样。

  2. search,在字符串中查找匹配的位置(第一个),成功时返回匹配的位置,失败返回-1

  3. replace,即用字符串替换匹配到的字符子串。

3.3 贪婪模式与懒惰模式

黄同学在ArkTs中使用正则表达式做匹配的时候,发现和使用Pythonre模块有所不同。在python中,使用 re.match 的时候,会先匹配到最短满足的字符串子串。而在ArkTs中,使用正则表达式和match的时候,会匹配到最长满足的字符串子串。

上面的文字描述可能会比较抽象,下面用示例来表示:注释中即为输出内容

  1. python:

    import re
    s = 'sttstts'
    pat = re.compile(r's.*s')
    print(pat.match(pat).group(0))		# stts
    
    • 1
    • 2
    • 3
    • 4
  2. ArkTs:

    let rep: RegExp = /s.*s/
    let s: string = 'sttstts'
    console.log(s.match(rep)[0])		// sttstts
    
    • 1
    • 2
    • 3

以上这两种情况其实就是,在正则表达式的相关概念中,其实就是关于匹配模式中的 贪婪模式懒惰模式

关于这两种的详细概念,如果朋友们想要了解,不妨去看看正则表达式的文档。黄同学在这里将用比较简单、浅显的文字表述来解释这两种模式:

  1. 这两种模式,具体的运作其实就和名字一样。贪婪模式其实就是尽可能匹配比较长的字符串,如上面的例子2中的输出,匹配过程很贪婪,和贪心算法思想类似,尽可能使匹配的结果长;而懒惰模式类似,就是匹配尽可能少的字符串,匹配到满足的即可。
  2. 这两种模式,其实就是为了让开发者能更加灵活的使用正则表达式。这种两种模式的区别主要体现在匹配多个字符的特殊正则表达式字符,比如正则表达式中 +* 等。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/317703
推荐阅读
相关标签