pandas 如何在网上报废所有的网址存在于excel文件中一气呵成

oxcyiej7  于 2023-02-02  发布在  其他
关注(0)|答案(1)|浏览(109)

我有一个文件输入.xlsx其中包含130 ursls链接,我想一次废弃所有的链接,并提取它们在一个文本文件中的URL_ID作为其文件名。
我是一个初学者在网页抓取,所以我需要堆栈溢出社区的支持和指导。

doinxwow

doinxwow1#

如果以zip格式打开Excel。请查找所有.xml.rels(.\xl\worksheets_rels)。您希望所有“Target”属性值都位于Relationship标记内

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<Relationships xmlns="http://schemas.openxmlformats.org/package/2006/relationships">
   <Relationship Id="rId1" Type="http://schemas.openxmlformats.org/officeDocument/2006/relationships/hyperlink" Target="https://www.theregister.co.uk/" TargetMode="External"/>
</Relationships>

相关问题