【Python】采集网页-匹配多行-正则表达式换行符_python 正则匹配网页原码包含多行的表格 - wpsshop博客

HelloWorld!

~

#如何解决？
..._python 正则匹配网页原码包含多行的表格">
查看
编辑修改
首页
UNITY
NODEJS
PYTHON
AI
GIT
PHP
GO
CEF3
JAVA
HTML
CSS
weixin_40725706
这个屌丝很懒，什么也没留下！
关注作者
热门标签
jquery
HTML
CSS
PHP
ASP
PYTHON
GO
AI
C
C++
C#
PHOTOSHOP
UNITY
iOS
android
vue
xml
爬虫
SEO
LINUX
WINDOWS
JAVA
MFC
CEF3
CAD
NODEJS
GIT
Pyppeteer
article
热门文章
1人工智能（AI）和机器学习_人工智能和机器学习
2unity-VRTK学习日记1（VRTK4|无头盔开发模拟器SpatialSimulator）_unityvr模拟器
3游戏引擎开发涉及的知识和技术_游戏开发涉及的系统
4Python 中的多线程和多进程 | 长文详解
5金融数据挖掘Jupyter—北京市二手房数据分析—课设_jupyter数据处理课设
6Efuse介绍及安全启动浅析
7new FormData() - FormData对象的作用及用法
8用23种设计模式打造一个cocos creator的游戏框架----(十八)责任链模式_cocos creator中好用的游戏框架
9Android 机器学习模型的轻量级框架 TensorFlow Lite_tensorflow android
10初中数学知识点总结_初中数学知识点总结(北师大)[1]最新版
当前位置: article > 正文
【Python】采集网页-匹配多行-正则表达式换行符_python 正则匹配网页原码包含多行的表格
作者：weixin_40725706 | 2024-02-19 08:24:03
赞
踩
python 正则匹配网页原码包含多行的表格

页面源码中带有换行符，或者想匹配多行内容，

<h3 id="hello">HelloWorld!</h3> <ul> #要抓取<ul>~</ul>之间的内容，即多行，包含\n <li> #如何解决？ <p>This is a big world!</p> </li> <li> <p>where are you from?</p> </li> </ul>

解决方法：

1.匹配前做处理：在获取页面源码后，用replace过滤掉所有的\n, 这样在匹配目标内容时，不再需要考虑\n.

html = html.replace('\n', '') target_contents = re.findall(r'r'<h3 id="hello">HelloWorld!</h3><ul>(.*?)</ul>'', html)

2.不处理抓取出来的源码, 在匹配时，注意正则表达式，不使用'.' ，使用[\s\S]：

\s --> 匹配任何空白字符，包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。
\S --> 匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

target_contents =

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/weixin_40725706/article/detail/113641
推荐阅读
article 人工神经网络之感知机架构、算法及python编程实现_人工神经网络算法代码 python...
人工神经网络（artificial neural network, ANN）是模拟人脑神经系统实现人工智能的一种途径。_...
赞
踩
article 【华为机试】2023年真题汇总B+C券（python）...
【华为机试】2023年真题汇总B+C券（python）【华为机试】2023年真题汇总B+C券（python） ...
赞
踩
article 最新华为OD机试（A卷+B卷+C卷）2024真题快速查找（Java+Python+C++）...
购买专栏，可以查看本专栏全部内容。购买专栏，可以私信博主获得辅导答疑服务。购买专栏，可以享受题目在线练习服务。最新华为O...
赞
踩
article ＜Python＞基于智谱AI图像大模型的图像生成程序(CogView)_智谱的cogview...
图片显示的实现，首先是使用requests去获取在线图片的数据，对于返回的图片元数据，我们使用Pillow库进行处理，最...
赞
踩
article python——matplotlib绘图详解大全...
Matplotlib中有多种定义颜色的方法，常见的方法包括：三元组 (Triplets)：颜色可以描述为一个实数三元组，...
赞
踩
article Python 深度学习实战：文本生成_深度学习实现文本生成的代码...
1.背景介绍深度学习（Deep Learning）作为人工智能的一个分支，一直在吸引着越来越多的人的关注。近年来，深度学...
赞
踩
article Python Tkinter Gui 运行不卡顿，多线程解决界面卡死问题_tkinter多线程...
Python Tkinter Gui 运行不卡顿，多线程解决界面卡死问题_tkinter多线程tkinter多线程 ...
赞
踩
article 使用OpenCV进行霍夫变换（C++/Python）_opencv c++图像分割霍夫变换...
前言首先，这是一篇英文博客的翻译，原地址：https://www.learnopencv.com/hough-trans...
赞
踩
article 解决报错：python setup.py egg_info did not run successf...
然后安装对应的步骤就可以了。最后通过下面的方法解决的。_python setup.py egg_info did not...
赞
踩
article OpenCV-Python图像处理：仿射变换详解及案例_仿射变换 opencv python...
本节介绍了仿射变换的概念、类型、基本仿射变换矩阵、OpenCV-Python与仿射变换相关的主要函数及语法说明，并提供了...
赞
踩
article opencv-python(七)：几何变换_图像几何矫正 python...
0. 图像几何变换图像几何变换是指对图像进行缩放、平移、旋转、仿射变换、偏移变换等。首先明确一点，图像是以矩阵存储的，所...
赞
踩
article Python - PhotoMaker 初体验 - 快来 DIY 你的图像_photomaker报错...
Python PhotoMaker DIY 自定义图像。_photomaker报错photomaker报错 ...
赞
踩
article 【Python VTK】读取二维序列医学图像分割结果并进行三维重建_vtk三维重建...
提供针对深度学习分割医学图像结果的三维重建思路，通过python vtk实现三维重建功能。提供一些指导思路和开发中遇到的...
赞
踩
article Py之cv2：cv2库(OpenCV，opencv-python)的简介、安装、使用方法(常见函数、...
关于OpenCV简介 OpenCV是一个基于BSD许可（开源）发行的跨平台计算机视觉库，可以运行在Linux、Windo...
赞
踩
article Python PyQt5的基本知识_python pyqt5 class __init__...
**Python PyQt5的基本知识+应用+案例**Python PyQt5的基本应用Demo1 加载图片、文件 de...
赞
踩
article python 之 PyQt5入门_python pyqt5...
前提一个GUI程序大体可以分为2个部分：创建用户界面本身（UI），然后编写代码让UI按照需求来实现功能。创建UI需要在窗...
赞
踩
article Python GUI编程之PyQt5入门到实战_python gui设计pyqt5从入门到实践 pd...
使用setWindowIcon方法来设置图标，窗口的setWindowIcon方法用于设置窗口的图标，只在Windows...
赞
踩
article Python Qt5环境搭建 (即详细又全面)_pythonqt的使用...
1.下载Python首先去Python官网下载需要的版本，官网连接：https://www.python.org/小插曲...
赞
踩
article python qt5教程_Python QT5 简洁入门...
我们先看下面一个简单的GUI代码：from PyQt5.QtWidgets import QApplication, Q...
赞
踩
article 【python】软件开发——PyQt5、Qt Designer、信号与槽机制、计算器实现_pytho...
PyQt5 是一个基于 Python 的 GUI 框架，用于创建跨平台的桌面应用程序。它是 Qt 库的 Python 绑...
赞
踩
相关标签
深度学习
笔记
神经网络
华为
python
华为机试
B卷
C卷
华为od
c语言
java
c++
开发语言
AI作画
pyqt5
matplotlib
大数据
人工智能
语言模型
AI
LLM
Java
Python
架构设计
Agent
Copyright © 2003-2013 www.wpsshop.cn 版权所有，并保留所有权利。

闽ICP备14008679号