词法分析器的工作过程分析_前端词法解析器

作者：运维做开发 | 2024-08-06 02:12:18

踩

前端词法解析器

Webkit中，有个词法分析器--HTMLTokenizer，她是怎么工作的呢，网页字节流是她的输入，她的输出是一个个的词语Token，比如div，input，img，script等等HTML文件中的标准元素(Element）。

前一篇文章关于DOM的创建里说过，HTML元字符解析器（HTMLMetaChractorParser）和HTML词法分析器（HTMLTokenizer）协同工作，一起分析、解析出词语(HTMLMetaChractorParser取出所有的页面中的字符，并调用HTMLTokenizer的nextToken函数处理它)：

下面这张图，就是Tokenizer具体的工作过程，我们看的出来，她是个状态机，先取<，再取>，就表示一个词语(token)结束了，之后进入下一个状态，周而复始。

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/运维做开发/article/detail/935338

词法分析器的工作过程分析_前端 词法 解析器

词法分析器的工作过程分析_前端词法解析器