Javascript正则表达式示例之HTML标签及HTML语法树
yund56 2025-07-18 01:10 3 浏览
上一节聊到正则表达式的简单应用,不足之处欢迎留言交流。
今天,我们来看一下,如何使用正则表达式,匹配HTML标签及相关信息。
为什么要加上相关信息呢?
因为,如果您想写一个HTML语法树解析库的时候,可能会用到。
下面内容用到的语法
|:表示或者,要么前面,要么后面
(?<=我前面出现的内容)要匹配的内容:只匹配前面出现的字符之后的内容。
要匹配的内容(?=我前面出现的内容):只匹配后面出现的字符之前的内容。
分组捕获:一对完整的小括号(),表示一个组。
\数字:你要使用那一个分组捕获到的内容。
.*?:在正则表达式中,. 表示匹配任意字符,* 表示匹配 0 到任意次的前一个字符,? 表示非贪婪匹配,即尽可能匹配最少的字符。因此,.*? 表示匹配任意字符零次或多次,但尽可能匹配最少的字符。这个表达式通常用于匹配一个字符串中的所有内容,但是避免贪婪匹配导致的匹配错误。
^: 表示匹配开始
[要匹配的字符]:只匹配括号中的字符。
比如[0-9]、[a-z]、[A-Z]、[0-9a-zA-Z]、[0-9abc]等等。
[^要匹配的字符]:[]中加^表示匹配不是“要匹配的字符”。
1、匹配所有HTML标签,并清空。实现innerText类似的功能。
<body><div id="left">left</div><div id="right">right</div></body>
const text = document.body.innerText;
text = text.replace(/\n/g, '');
console.log(text);
//输出: leftright
假设没有innerText的功能呢?实现这个功能,使用正则表达式无疑是最方便的。
var text = document.body.innerHTML.replace(/<[^>]+>/g,'');
text = text.replace(/\n/g, '');
console.log(text);
//输出: leftright
是的,这个正则表达式的意思是,查找<>并且包含他们之间不为>的一段字符串。
到这里,您以为就结束了吗?您在网上搜索匹配HTML标签,可能也会得到这么一个结果(例如:<[^>]+>、<.*?>、等等),但实际上这只是开始,我们本着只要是程序就可能有bug的原则,所以我们来看下面一个例子。
const strHtml = '<span data-code=">">>是大于符号。</span>';
const strRes = strHtml.replace(/<[^>]+>/g, '');
console.log(strRes);
// ">>是大于符号。
bug出现了,怎么办?别着急,请看下一个知识点。
2、匹配HTML标签属性,是写一个HTML语法树要经历的事情。
2.1、首先,我们先解决第一点最后的bug。
const strHtml = '<span data-code=">">>是大于符号。</span>';
// 一个小改动即可。
const strRes = strHtml.replace(/<("[^"]*"|[^>])+>/g, '');
console.log(strRes);
// >是大于符号。
完美 ,还没结束……
const strHtml = "<span data-code='>'>>是大于符号。</span>";
const strRes = strHtml.replace(/<("[^"]*"|[^>])+>/g, '');
console.log(strRes);
// '>>是大于符号。
甲:这不是我写的HTML不标准,是你的解析库兼容性不好,浏览器都可以识别,你为什么不可以?
已:……。
const strHtml = `<i code="<"><小于符号。</i><i code='>'>>大于符号。</i>`;
// 继续改造
const strRes = strHtml.replace(/<((["'])+.*?\2|[^>])+>/g, '');
console.log(strRes);
// <小于符号。>大于符号。
是的,利用正则表达式分组捕获的语法,实现了上面的需求。
2.2 现在,我们来看看,如何找到某个标签的所有属性。
const strHtml = `
<input type='text' disabled value="" class="txt txt-md" v-on:click="save('button')" />
`;
上面的例子中,有多种情况,我们首先来整理出来。
属性1:type='text'
/[\w]+=(["'])+.*?\1/
属性2:disabled
/[\w]+/
属性3:value=""
/[\w]+=(["'])+.*?\1/
属性4:class="txt txt-md"
/[\w]+=(["'])+.*?\1/
属性5:v-on:click="save('button')"
/[\w:]+=(["'])+.*?\1/
其他情况:欢迎讨论。
把所有情况连起来之后。
const strHtml = `<input type='text' disabled value="" class="txt txt-md" v-on:click="save('button')" />`;
const tagAttrs = strHtml.match(/(?<=\s)[\w:-]+(=(["']).*?\2)*/g) || [];
console.log(tagAttrs);
// ["type='text'", 'disabled', 'value=""', 'class="txt txt-md"', `v-on:click="save('button')"`]
人人为我,我为人人,欢迎您的浏览,我们一起加油吧。
相关推荐
- 什么是JavaScript,它能做什么(javascript干啥的)
-
一个页面分成三个部分,结构,样式,行为。HTML代表了页面的结构(骨架),CSS代表了页面的样式(皮肤),JavaScript代表了页面的行为(这种行为是被动的)。主动的行为需要一个大脑,后端作为我们...
- 一款自定义字幕内容的截屏生成器:fake-screenshot!
-
这是一个可以伪造任何网站界面截图的工具。但本工具的目的其实不是破坏,而是为了警告:不要轻易相信网上看到的“截图”!本工具的目的是传递(如上的)信息,而不是破坏。因此所有经过本工具制作出来的截图都被打...
- JavaScript-JavaScript 219
-
1)JavaScript简介JavaScript:是一种脚本语言(程序),脚本是一条条的文字命令,执行时由系统的一个解释器将其一条条的翻译成机器可识别的指令然后执行,脚本语言是不经编译而是解释执行的,...
- Vue3 神级工具:终于可以实现打字的动画效果了!
-
Typed.js是一个轻量级的JavaScript库,用于在网页上实现打字机动画效果。它支持自定义打字速度、循环模式、回调函数等,非常适合用于动态展示标语、代码片段或交互式文本效果。核心特性打字...
- 好用的JavaScript客户端PDF插件——jsPDF
-
介绍和往常一样,jsPDF是一个开源的客户端的PDF解决方案,在之前的文章中已经介绍过几个Web端和PDF相关的库,jsPDF同样是一个不错的客户端PDF引SDK,你可以通过jsPDF在客户端完成相...
- 历时10个多月,学习了这132 个CSS 特效,还不来学习
-
这132个特效,是我历时10个多月在油管一个一个跟着敲出来的,为了加强记忆,每个练习,我都录制了视频,在这里分享出来给大家。大家可能又会调侃了,你是工作不饱和吧,有时间做这些。其实,我目前工作还是挺饱...
- Flux.1 Kontext:用文字编辑图像(flux.1.kontext)
-
FLUX.1Kontext是来自BlackForestLabs的一款新图像编辑模型。它是用于通过文本提示编辑图像的最佳模型之一,并且是FLUX.1家族的最新成员。在我们的测试中,我们发...
- 采用Stylus 扩展让你的浏览器字体变得更美观
-
今天锋哥带大家来玩一个有意思的操作。我对字体有着很高的敏感度,我对网页默认的字体,不是很满意。突如其来的疯狂念头,我能不能把我们网页的所有字体,就是默认的字体,强制改为我喜欢的这个霞鹜文楷字体呢?答案...
- JavaScript奇技淫巧:隐形字符(javascript字符型转数值型方法)
-
JavaScript奇技淫巧:隐形字符本文,分享一种奇特的JS编程技巧,功能是:可以使字符串“隐形”、不可见!效果展示如下图所示,一个字符串经物别的操作之后,其长度有621字节,但内容却是“隐形”不可...
- Axure9原型设计:能增删改数据的动态饼图(2)
-
在本篇中,我们将延续上篇的设计思路,进一步探索如何在Axure9中实现“可增删改数据”的动态饼图效果。最近无聊,在网上闲逛,看到一篇教程《能增删改数据的动态饼图》,故仿照实践。因信息量较大,分三篇...
- JavaScript奇淫技巧:命令行语法高亮
-
JavaScript奇淫技巧:命令行语法高亮本文,将实现命令行输出带有语法高亮、带行号的JS代码。效果如下图所示:对于JS程序员而言,这个效果是有些惊喜的。而实现起来,却似乎是出乎意料的简单。直接上源...
- JS如何判断文字被ellipsis了?(js判断字符是否存在)
-
原文来源于:程序员成长指北;作者:嘉琪coder如有侵权,联系删除前言如果想要文本超出宽度后用省略号省略,只需要加上以下的css就行了。ellipsis{overflow:hidden;...
- 前端资源-实用的JS插件(前端js工具)
-
现在前端资源越来越多,有创意十足的,有实用性高的,这些对于设计师和前端人员来说都是不错的灵感和资源,所以我们可多关注这些信息,对自己的专业技术有也会帮助的。今天设计达人网为大家分享有:页面进度条、图像...
- p5.js 中文入门教程(p5js编辑器不能用)
-
本文简介点赞+关注+收藏=学会了本文的目标是和各位工友一起有序的快速上手p5.js,会讲解p5.js的基础用法。本文会涉及到的内容包括:项目搭建p5.js基础2D图形文字图形样式...
- 创建酷炫动画效果的10个JavaScript库
-
Dynamics.js是设计基于物理规律的动画的重要JavaScript库。它可以赋予生命给所有包含CSS和SVG属性的DOM(文本对象模型)元素,换句话说,Dynamics.js适用于所有Java...
- 一周热门
- 最近发表
-
- 什么是JavaScript,它能做什么(javascript干啥的)
- 一款自定义字幕内容的截屏生成器:fake-screenshot!
- JavaScript-JavaScript 219
- Vue3 神级工具:终于可以实现打字的动画效果了!
- 好用的JavaScript客户端PDF插件——jsPDF
- 历时10个多月,学习了这132 个CSS 特效,还不来学习
- Flux.1 Kontext:用文字编辑图像(flux.1.kontext)
- 采用Stylus 扩展让你的浏览器字体变得更美观
- JavaScript奇技淫巧:隐形字符(javascript字符型转数值型方法)
- Axure9原型设计:能增删改数据的动态饼图(2)
- 标签列表
-
- filter函数js (37)
- filter函数excel用不了 (73)
- 商城开发 (40)
- 影视网站免费源码最新版 (57)
- 影视资源api接口 (46)
- 网站留言板代码大全 (56)
- java版软件下载 (52)
- java教材电子课本下载 (48)
- 0基础编程从什么开始学 (50)
- java是用来干嘛的 (51)
- it入门应该学什么 (55)
- java线上课程 (55)
- 学java的软件叫什么软件 (38)
- 程序开发软件有哪些 (53)
- 软件培训 (59)
- 机器人编程代码大全 (50)
- 少儿编程教程免费 (45)
- 新代系统编程教学 (61)
- 共创世界编程网站 (38)
- 亲测源码 (36)
- 三角函数积分公式表 (35)
- 函数的表示方法 (34)
- 表格乘法的公式怎么设置 (34)
- sumif函数的例子 (34)
- 图片素材 (36)