当前位置：主页 > 查看内容

如何从URL中快速提取域名？

发布时间：2021-07-15 00:00| 有位朋友查看

简介：有时候，我们要从一段很长的 URL 里面提取出域名。例如从 https://www.kingname.info/2020/10/02/copy-from-ssh/，我需要获取的是kingname.info。可能有人会这样写代码： url = 'https://www.kingname.info/2020/10/02/copy-from-ssh/' domain = '.' .join(……

有时候，我们要从一段很长的 URL 里面提取出域名。例如从

https://www.kingname.info/2020/10/02/copy-from-ssh/，我需要获取的是kingname.info。

可能有人会这样写代码：

url = 'https://www.kingname.info/2020/10/02/copy-from-ssh/' 
domain = '.'.join(url.split('/')[2].split('.')[1:])

运行效果如下图所示：

但如果我给出的 URL 没有带 https://，这段代码的结果就有问题。

而且，有些域名可能有三级、四级域名，例如：blog.exercise.kingname.com.cn。显然，使用点分割以后，也不知道怎么拿到真正的域名kingname.com.cn。

还有一些人的需求可能只需要域名中的名字，例如kingname.info只要kingname，google.com.hk只要google。

对于这些需求，如果手动写规则来提取的话，会非常麻烦。

不过好在 Python 有一个第三方库已经解决了这个问题，这就是tld。

我们先来安装它：

python3 -m pip install tld

安装完成以后，我们来看看它的使用方法：

>>> url = 'https://www.kingname.info/2020/10/02/copy-from-ssh/' 
>>> from tld import get_tld 
>>> result = get_tld(url, as_object=True) 
>>> domain = result.domain 
>>> print(domain) 
kingname 
>>> domain_with_suffix = result.fld 
>>> print(domain_with_suffix) 
kingname.info

首先使用get_tld生成一个对象，然后通过对象的.domain属性获得纯域名，使用.fld属性，获得带有后缀的域名。

运行效果如下图所示：

对于不含https的网址，直接使用会报错，如下图所示：

但只要加上一个参数fix_protocol=True就可以解决问题：

【责任编辑：赵宁宁 TEL：（010）68476606】
本文转载自网络，原文链接：http://mp.weixin.qq.com/s?__biz=MzI2MzEwNTY3OQ==&mid=2648979552&idx=1&sn=50eedb54e3d59d584481d82180e482dd&chksm=f2506580c527ec960e50c1b483c368cfb4d25ff40ccf0bdd3a20ae5d1a54b0f531dbf955ef1e&mpshare=1&s
本站部分内容转载于网络，版权归原作者所有，转载之目的在于传播更多优秀技术内容，如有侵权请联系QQ/微信：153890879删除，谢谢！

上一篇：Gartner：2021年及以后IT组织和用户十大趋势预测 下一篇：没有了

随机推荐

5G加速到来，才换的4G手机会不会被淘汰

三千兆将落地武汉。这意味着，将来无论是室内还是室外、有线还是无线、手机还是...
消息称印度已禁用224款中国App：数量还会

据印度《金融快报》报道称，印度政府已经禁用了我国224款App，而且这个数量有望...
安全可控、依法合规人工智能落地金融领

如今，随着国家新兴数字化基础设施的推进，5G、云计算、大数据等模块的成熟，人...
5G赋能工业互联网加速落地助力制造业转

工信部近日印发《工业互联网创新发展行动计划(2021-2023年)》指出，到2023年将在...
如何实现数据中心采用清洁能源的目标

全球知名的一些科技公司承诺为其运营的数据中心提供100%可再生能源的电力。许多...
5G手机卖爆了！网友：信号和套餐跟不上也

今年双11，手机是各电商平台销售最为火爆的产品品类之一，其中5G手机为销售主流...
Nodejs每日一讲之Nodejs的进程间通信

本文转载自微信公众号「编程杂技」，作者theanarkh。转载本文请联系编程杂技众...
唯美爱情文字图片：你的幸福路人皆知，我

1．这个世界除了你，再不会有人这样让我坚定到失控。 2．你逢场作戏，我将计就计...
三分钟回顾！12月网络安全领域重要动态速

【责任编辑：贺鑫 TEL：（010）68476606】本文转载自网络，原文链接：...
你的企业Wi-Fi速度够快吗?

无论您是尝试解决问题，确保带宽密集型客户端都能正常工作、微调性能还是对Wi-Fi...

如何从URL中快速提取域名？

推荐图文

6大人工智能应用的关键技术详解

我们该如何正确的中断一个正在执行的线程？？

苹果发布iOS 13重大更新：iPhone终于不绿了！

微信 8.0 添加好友，必须设置好友权限

如何寻找人工智能在网络安全中发挥作用的新机会

专家辟谣！5G用户大可放心，运营商未曾关闭NSA网络

随机推荐

5G加速到来，才换的4G手机会不会被淘汰

消息称印度已禁用224款中国App：数量还会

安全可控、依法合规人工智能落地金融领

5G赋能工业互联网加速落地助力制造业转

如何实现数据中心采用清洁能源的目标

5G手机卖爆了！网友：信号和套餐跟不上也

Nodejs每日一讲之Nodejs的进程间通信

唯美爱情文字图片：你的幸福路人皆知，我

三分钟回顾！12月网络安全领域重要动态速

你的企业Wi-Fi速度够快吗?

关于我们