"我所需要的"
我有一个img src链接列表。下面是一个例子:
https://studiocake.kiev.ua/wp-content/webpc-passthru.php?src=https://studiocake.kiev.ua/wp-content/uploads/photo_2020-12-27_12-18-00-2-333x444.jpg&nocache=1
https://studiocake.kiev.ua/wp-content/webpc-passthru.php?src=https://studiocake.kiev.ua/wp-content/uploads/IMG_4945-333x444.jpeg&nocache=1
https://studiocake.kiev.ua/wp-content/webpc-passthru.php?src=https://studiocake.kiev.ua/wp-content/uploads/tri-shokolada.png&nocache=1
我需要得到以下结果:
studiocake.kiev.ua/wp-content/uploads/photo_2020-12-27_12-18-00-2-333x444.jpg
studiocake.kiev.ua/wp-content/uploads/IMG_4945-333x444.jpeg
studiocake.kiev.ua/wp-content/uploads/tri-shokolada.png
问题
我使用以下正则表达式:
studiocake\.kiev\.ua.*(jpeg|png|jpg)
但是它并没有按照我需要的方式工作。我得到的不是我需要的结果,而是这样的链接:
studiocake.kiev.ua/wp-content/webpc-passthru.php?src=https://studiocake.kiev.ua/wp-content/uploads/photo_2020-12-27_12-18-00-2-333x444.jpg
问题
如何使用Python正则表达式获得所需的结果
3条答案
按热度按时间n53p2ov01#
您可以让greedy
.*
* 消耗 * 起始匹配,capture消耗后者。See this demo at regex101(group 1 中的匹配项)或www.example.com上的Python演示tio.run
内部使用了
\S*
来匹配characters other than a whitespace的any amount。我进一步添加了一些
\b
word boundaries和(?i)
-flag,用于 * 忽略大小写 *。64jmpszr2#
你想要实现的是对URL的标准操作,python有很多库来实现这一点。在这个练习中,我建议使用URL解析库,而不是使用regex,它提供了标准操作,并提供了更好的代码。
输出量:
dfuffjeb3#
我的表情是这样的
将其替换为
$4
说明...
我只是选择了部分中的所有链接,然后将其替换为所需的特定部分。