我试图检查是否2网址有相同的域使用prase.urlparse像这样:
if parse.urlparse(url1).hostname == parse.urlparse(url2).hostname:
print('Same Domain')
else:
print('Different Domain')
虽然这适用于:https://example.com/page1
和https://example.com/page1
它不适用于:https://sub1.example.com/page1
和https://sub2.example.com/page1
由于第一个url的返回主机名为sub1.example.com
,第二个url的返回主机名为https://sub2.example.com/page1
...
如果我只关心主域而不关心子域呢?
我想单独检索example.com
,而不是手动将url解析为字符串,而是使用库来处理类似parse.urlprase的情况。
1条答案
按热度按时间gg0vcinb1#
你不能。
解释原因here
简而言之,没有办法知道sub2.domain.tld的哪个部分是一级域、域名还是子域,就像您有
example.co.uk
或类似的