我正在尝试使用python获取linkedin配置文件的“id”。我指的是身份证 https://www.linkedin.com/in/adigup21/ ,它应该得到adigup21。我在用这个把戏 ID = (link.lstrip("https://www.linkedin.com/in/").rstrip('/')) 但在某些情况下,它会漏掉字符或为空(我总是确保格式相同且良好)有没有准确的替代方案?
https://www.linkedin.com/in/adigup21/
ID = (link.lstrip("https://www.linkedin.com/in/").rstrip('/'))
ffvjumwh1#
link.rstrip('/').split('/').pop() rstrip删除(可选)最后一个斜杠,split用斜杠分隔的部分组成一个数组,pop提取最后一个元素。顺便说一句,这只是一个黑客。操作url元素最好是通过url解析来完成,方法如下 pth=urllib.parse.urlparse(link).path 然后可以在pth上执行rstrip/split/pop操作。
link.rstrip('/').split('/').pop()
pth=urllib.parse.urlparse(link).path
1条答案
按热度按时间ffvjumwh1#
link.rstrip('/').split('/').pop()
rstrip删除(可选)最后一个斜杠,split用斜杠分隔的部分组成一个数组,pop提取最后一个元素。顺便说一句,这只是一个黑客。操作url元素最好是通过url解析来完成,方法如下
pth=urllib.parse.urlparse(link).path
然后可以在pth上执行rstrip/split/pop操作。