我有一个文件输入.xlsx其中包含130 ursls链接,我想一次废弃所有的链接,并提取它们在一个文本文件中的URL_ID作为其文件名。我是一个初学者在网页抓取,所以我需要堆栈溢出社区的支持和指导。
doinxwow1#
如果以zip格式打开Excel。请查找所有.xml.rels(.\xl\worksheets_rels)。您希望所有“Target”属性值都位于Relationship标记内
<?xml version="1.0" encoding="UTF-8" standalone="yes"?> <Relationships xmlns="http://schemas.openxmlformats.org/package/2006/relationships"> <Relationship Id="rId1" Type="http://schemas.openxmlformats.org/officeDocument/2006/relationships/hyperlink" Target="https://www.theregister.co.uk/" TargetMode="External"/> </Relationships>
1条答案
按热度按时间doinxwow1#
如果以zip格式打开Excel。请查找所有.xml.rels(.\xl\worksheets_rels)。您希望所有“Target”属性值都位于Relationship标记内