先引入urllib模块
成都创新互联企业建站,十余年网站建设经验,专注于网站建设技术,精于网页设计,有多年建站和网站代运营经验,设计师为客户打造网络企业风格,提供周到的建站售前咨询和贴心的售后服务。对于成都做网站、成都网站制作中不同领域进行深入了解和探索,创新互联在网站建设中充分了解客户行业的需求,以灵动的思维在网页中充分展现,通过对客户行业精准市场调研,为客户提供的解决方案。
假如我们要对下面的url进行转码,注意观察各种字符的变化
使用quote方法,进行转码
我们看看转码得到的结果:
我们想要得到原先的url,可以使用quote的逆函数unquote
得到反转码以后的url,我们看到这种方法并没有返回中文字符。
作用就是把合理的数据转换为需要的类型。int()整数,float()浮点数,str()字符串,list()列表,tuple()元组,set()集合……
比如a='12'这个是字符串类型,用int函数a=int(a)这时变量a就是整型,字符串'12'变为了整数12。Python没有变量声明的要求,变量的属性在赋值时确定,这样变量的类型就很灵活。
有一种题目判断一个整数是否回文数,用字符串来处理就很简单
a=1234321#整数
if str(a)==str(a)[::-1]:#借助字符串反转比较就可以确定是否回文数。
还比如元组b=(1,3,2,4),元组是不可以更新删除排序成员的,但是列表是可以的,通过列表函数进行转换来实现元组的更新删除和排序。
b=(1,3,2,4)
b=list(b)
b.sort()
b=tuple(b)
这时得到的元组b就是一个升序的元组(1,2,3,4)
再比如你要输入创建整数列表或者整数元组基本上写法相同,就是用对应的函数来最后处理。
ls=list(map(int,input().split()))#这个就是列表
tup=tuple(map(int,input().split()))#这个就是元组
再比如有个叫集合的,集合有唯一性,可以方便用来去重。
ls=[1,2,3,1,2,3,1,2,3]
ls=list(set(ls))#通过set()去重后,现在的ls里就是[1,2,3]去重后的列表。
对于单个字符的编码,Python提供了ord()函数获取字符的整数表示,chr()函数把编码转换为对应的字符:
最常用的编码是UTF-8,如果没有特殊业务要求,请牢记仅使用UTF-8编码。
在爬虫中会经常遇见,需要用encode和decode来进行互相转码
str转bytes
注意,含有中文字符的str不能用acsii格式转码
bytes转str
** 程序中经常会遇到个别字符转码不成功而报错,因此在decode方法中需要这个参数errors='ignore'忽略错误的字节
注意格式化的数据格式