高效文本处理之查找替换|各类工具+正则表达式或通配符使用
yund56 2025-04-25 17:24 34 浏览
各工具在查找替换时可使用的正则表达式或通配符各有不同,可考虑使用的工具及特点有:
1 word,有丰富的查找替换选项;
2 notepad,可打开多个文档操作;
2 dreamweaver,较好支持正则表达式及多行查找操作;
4 python,使用正则表达式做查找替换时,功能强大;
如相同功能存在的一些细微区别:
分组替换 python是\1\2\3,dreamweaver是$1$2$3
段落标记:word使用^p,dreamweaver是\n或直接在文本框中按:shift+enter
1 word
word查找替换存在丰富的可选项组合:
特殊格式不同的对话框:
2 notepad
notepad支持在文件夹选择多个文件时,右击,可同时打开,并有“替换所有打开文件”的操作:
3 dreamweaver
dreamweaver的查找替换对话框,对于正则表达式有较好的支持:
简单解释以上正则表达式:
<p>(\d*[.]{1}\d*)(\s.)(.*?)</p>
[.]{1} 是指匹配英文句点.。
.*? 是指匹配除任意换行符以外的任意多字符。
可以直接作用多行文本:
4 python
当然,较复杂或需要完成较多的较固定的查找替换时,可以写一个简单的小程序,编程语言对于字符串操作支持都是其最基本的功能,而较容易使用的编程语言就是python了。
import sys
import os
import re
rInit = open('init.txt','rU',encoding='UTF-8')
wTemp = open('temp.txt','w',encoding="UTF-8")
nfn = str(rInit.readline()) # 第一行用作标题
nfn =nfn.replace("<p>","")
nfn =nfn.replace("</p>","")
s = rInit.read() # 整个文本文件作为一个字符串返回
s = s.replace(' ','') # 处理全角空格
s = s.replace("<<","<<")
s = s.replace("#include <","#include <")
s = s.replace("#include<","#include<")
#s = s.replace(">",">")
s = s.replace(',?' , ',”')
s = s.replace('.?' , '.”')
s = s.replace('\n\r' , '\n')
s = s.replace('\r\n' , '\n')
s = s.replace(' ' , '\n\n')
s = re.sub(r'</div><div class="\w\d*">', '<p></p>', s)
rejiu =re.compile(r'<\S{,8}九\S{,22}</\S{,5}>')
s = rejiu.sub("", s)
wTemp.write(nfn) # 标题写回
wTemp.write("\n")
wTemp.write(s)
rInit.close()
wTemp.close()
-End-
相关推荐
- 如何在Office 中编辑 PDF?附详细化步骤
-
PDF很受欢迎,因为它能在不同的设备和操作系统上仍然保持原有格式。但是,这也意味着直接更改PDF文件比其他格式更难更复杂。值得庆幸的是,Microsoftoffice和UPDF帮你解决这一难题。一...
- 我的 Windows 装机必备软件清单
-
今天给大家分享下我的装机必备软件,都是用了好多年的软件神器。靠谱、好用、无广告,Windows电脑必备软件,收藏这一篇就够了!01.浏览器王者:Chromehttps://www.google.c...
- Docnet Core 是一个轻量级、高性能的 .NET PDF 操作库
-
DocnetCore介绍DocnetCore是一个轻量级、高性能的.NETPDF操作库,依托于PDFium渲染引擎,提供强大的PDF文档解析、渲染、操作等功能。它完全支持.NET...
- 分享三款好用的PDF编辑软件,轻松处理PDF
-
作为一名需要经常和PDF文件打交道的工作者,我来分享一下几款好用的PDF编辑软件,并详细分析了它们的优缺点,希望能帮你找到合适的工具。1.AdobeAcrobatDC作为PDF格式的发明者,Ado...
- PDF文档创建工具软件:novaPDF OEM 11.9 Build 432 for Windows
-
novaPDFOEM是一款实用高效的软件,从头开始设计,让您尽可能轻松地在应用程序中添加PDF打印功能。换句话说,这个实用程序是专门为应用程序开发人员设计的,可以直接在程序安装程序中集成为PDF打印...
- 线性表顺序存储结构求集合的并,交,补,差(源代码附上 超详细)
-
一:算法分析1)用数组A,B,C,E表示集合。假定A={1,3,4,5,6,7,9,10}, B={2,,3,4,7,8,10},E={1,2,3,4,5,6,7,8,9,10}, 输入数组A...
- 分享一套SpringBoot开发博客系统源码,包含完整开发文档和视频
-
基本信息项目名称:eblog摘要:eblog是一个基于Springboot2.1.2开发的博客学习项目,为了让项目融合更多的知识点,达到学习目的,编写了详细的从0到1开发文档。主要学习包括:自定义Fr...
- 通达信指标合集〔源码齐全〕
-
很多朋友问到我哪款指标好用,这里我说一下,之所以有很多不同的指标是因为我们在针对不同的盘面情况的时候使用的指标是不同的,我给到的指标一般来讲就目前的环境来讲都是比较适合的,今天我就把我平时自己常用的指...
- 巅峰对决!Spring Boot VS .NET 6
-
SpringBoot和ASP.NETCore都是企业中流行的Web框架,对于喜欢C#的人会使用ASP.NETCore,而对于Java或Kotlin等基于JVM的语...
- 在asp.net core 中控制访问权限的方法
-
Intro#由于项目需要,需要在基于asp.netmvc的Web项目框架中做权限的控制,于是才有了这个权限控制组件,最初只是支持netframework,后来dotnetcore2.0...
- ASP.NET是否无生存之地?
-
ASP.NET,这个已经很久的技术,总觉得已经被时代淘汰,我们公司是一个10人小公司,几个十年十五年的项目还是用ASP.NET开发的。这两年由于客户的需求变化,我们公司也顺势开始对这些项目重新开发,改...
- Spring Boot + Vue.js 实现前后端分离(附源码)
-
作者:梁小生0101链接:juejin.im/post/5c622fb5e51d457f9f2c2381SpringBoot+Vue.js前后端涉及基本概念介绍,搭建记录,本文会列举出用到环...
- ASP.NET Core 中的 Mapster 使用入门教程
-
在本文中,我们将学习如何在ASP.NETCore应用程序中使用Mapster。首先,我们将了解Mapster是什么以及如何将其安装到.NETCore应用程序中。然后,我们将在使用...
- Asp.net常用方法及request和response-a
-
asp.net教程asp.net常用方法:1、Request.UrlReferrer请求的来源,可以根据这个判断从百度搜的哪个关键词、防下载盗链、防图片盗链,可以伪造(比如迅雷)。(使用全局一般处理...
- ASP.NET Core使用功能开关控制路由访问
-
前言在前面的文章,我们介绍了使用Middleware有条件地允许访问路由(《ASP.NETCore使用Middleware有条件地允许访问路由》)。而对于一些试验性的功能,我们并不希望用密码去控制是...
- 一周热门
- 最近发表
- 标签列表
-
- filter函数js (37)
- filter函数excel用不了 (73)
- 商城开发 (40)
- 影视网站免费源码最新版 (57)
- 影视资源api接口 (46)
- 网站留言板代码大全 (56)
- java版软件下载 (52)
- java教材电子课本下载 (48)
- 0基础编程从什么开始学 (50)
- java是用来干嘛的 (51)
- it入门应该学什么 (55)
- java线上课程 (55)
- 学java的软件叫什么软件 (38)
- 程序开发软件有哪些 (53)
- 软件培训 (59)
- 机器人编程代码大全 (50)
- 少儿编程教程免费 (45)
- 新代系统编程教学 (61)
- 共创世界编程网站 (38)
- 亲测源码 (36)
- 三角函数积分公式表 (35)
- 函数的表示方法 (34)
- 表格乘法的公式怎么设置 (34)
- sumif函数的例子 (34)
- 图片素材 (36)