本文共 7021 字,大约阅读时间需要 23 分钟。
前面四篇我们已经讲了许多概念方面的东西,从此篇开始,我们将真正开始学习python。
在中,我们已经说过python有哪些核心数据类型,接下来我们将一一细说这些数据类型。
python数据类型之数字类型
python使用5种数字类型:布尔型、整型、长整型、浮点型和复数,所有数字类型均为不可变对象。
math模块是python中专门用来实现高级算术运算的模块。
数字支持以下操作:
+:加法
-:减法
*:乘法
/:除法
//:截断除法
**:乘方
%:取模
-=:一元减法
+=:一元加法
*=:一元乘法
/=:一元除法
数字支持以下比较运算:
<<:左移,右边补0
>>:右移,左边补0
&:按位与
|:按位或
^:按位异或(位相同则为0,不同则为1)
1 ^ 0 值为1
1 ^ 1 值为0
~:按位求反
python数据类型之序列类型
序列表示索引为非负整数的有序对象集合,包括字符串、列表和元组。
字符串是字符类型,字符串也属于序列类型,同样支持迭代。
列表和元组是任意python对象的序列。
字符和元组属于不可变序列,而列表则支持插入、删除和替换元素。
所有序列都支持迭代。
python序列类型之字符类型
指定字符串字面量:把文本放入单引号、双引号或三引号中。
在python2.0系列当中,字符串字面量(str)对应于8位字符(8bit数据)或面向字节的数据,因此无法完全支持国际字符集(Unicode)。
在python2系列中,如果想用Unicode进行编码,则必须在定义字符串时在其之前加上一个u来表示,如u'abc',而python3系统则不用加u,python3可以自动在类型之间转换,而且已经支持Unicode编码。
python2系列提供两种字符串对象类型:
字节字符串:字节(8bit数据)序列;
Unicode字符串:Unicode字符(16bit)序列
python可以使用32bit整数保存Unicode字符,但此为可选特性。
文档字符串:若模块、类或函数的第一条语句是一个字符串的话,该字符串就成为文档字符串,可以使用__doc__属性来引用。
文档字符串在代码段中,要与其它语句的缩进保持一致。
适用于字符串的操作与方法:
s.captitalize():首字符变大写
s.index(sub [, start [, end]]):找到指定字符串sub首次出现的位置,否则报错
s.join(t):使用s作为分隔符连接序列t中的字符串
s.lower():转换为小写形式
s.replace(old, new [, maxreplace]):替换一个字符串
s.split([sep [, maxsplit]]):使用sep作为分隔符对一个字符串进行划分,maxsplit是划分的最大次数
s.strip([chars]):删掉chars开头和结尾的空白或字符
s.upper():将一个字符串转换为大写形式
python序列类型之列表
列表是一种容器类型:
可以包含任意对象的有序集合,通过索引进行访问其中的元素,是一种可变对象,其长度可变
支持异构和任意嵌套
支持在原处修改:
修改指定的索引元素
l1[2] = 'abc'
修改指定的分片
l1[1:3] = []
删除语句
del l1[2]
del l1[1:]
或使用del函数
del(l1[2])
del(l1[1:])
适用于列表的操作与方法:
list(s)可将任意可迭代类型转换为列表,而如果s已经是一个列表,则该函数构造的新列表是s的一个浅复制
list(s):将s转换为一个列表
s.append(x):将一个新元素x追加到s末尾
s.extend(t):将一个新元素t追加到s末尾
s.count(x):计算s中x的出现次数
s.index(x, [, start [, stop]]):当s[i] == x.start时返回最小的i,可选参数stop用于指定搜索的起始和结束索引
s.insert(i,x):在索引i处插入x
s.pop([i]):返回元素i并从列表中移除它。如果省略i,则返回列表中最后一个元素并从列表中移除它
s.remove(x):搜索x并从s中移除它
s.reverse():颠倒s中的所有元素的顺序
s.sort([key [, reverse]]):对s中的所有元素进行排序。key是一个键函数。reverse是一个标志,表明以倒序对列表进行排序。key和reverse应该始终以关键字参数的形式指定
list1 + list2:合并两个列表,返回一个新的列表,不会修改原列表
list1 * N:把list1重复N次,返回一个新列表
in:成员关系判断字符,用法:object in container
not in:成员关系判断字符,用法:object not in container
浅复制与深复制的区别?
浅复制:浅复制时,复制者与被复制者在内存中实际上是同一个对象引用
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | In [ 1 ]: list1 = [ 1 , 2 , 3 ] In [ 2 ]: list2 = list1 In [ 3 ]: print list1 [ 1 , 2 , 3 ] In [ 4 ]: print list2 [ 1 , 2 , 3 ] In [ 5 ]: id (list1) Out[ 5 ]: 140347116298112 In [ 6 ]: id (list2) Out[ 6 ]: 140347116298112 |
深复制:深复制时,复制者与被复制者在内存中是两个不同的对象引用
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | In [ 7 ]: list1 = [ 1 , 2 , 3 ] In [ 8 ]: list2 = list1[:] In [ 9 ]: print list1 [ 1 , 2 , 3 ] In [ 10 ]: print list2 [ 1 , 2 , 3 ] In [ 11 ]: id (list1) Out[ 11 ]: 140347117118024 In [ 12 ]: id (list2) Out[ 12 ]: 140347117098696 |
也可以通过copy模块的deepcopy方法来实现深复制
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | In [ 13 ]: import copy In [ 14 ]: list3 = copy.deepcopy(list1) In [ 15 ]: print list1 [ 1 , 2 , 3 ] In [ 16 ]: print list3 [ 1 , 2 , 3 ] In [ 17 ]: id (list1) Out[ 17 ]: 140347117118024 In [ 18 ]: id (list3) Out[ 18 ]: 140347117091008 |
python序列类型之元组
元组是一种容器类型,但是其是不可变对象。表达式符号是()
可以包含任意对象的有序集合,通过索引访问其中的元素,是一种不可变对象,长度固定
支持异构和任意嵌套
支持索引、切片、成员关系判断、合并、重复
元组的常见操作有以下这些:
():定义空元组
(1,):定义一个元素的元组
(1,2,3):定义元组
tuple1 + tuple2:全并两个元组,生成一个新元组,不会修改原元组
tuple1 * N:把tuple1重复N次,返回一个新元组
in:成员关系判断字符,用法:object in container
not in:成员关系判断字符,用法:object not in container
在不引起语法冲突的前提下,元组定义时、使用时允许省略()。一般而言,仅当元组作为字符传给函数调用以及当元组出现在print语句的特殊情况时,()是必要的。
元组本身不可变,但当元组内嵌套了可变类型的元素,那么此类元素的修改不会返回新元组
例如当元组中包含列表时,可以对元组中列表的元素进行修改,但是不会返回一个新的元组,元组本身并未改变
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | In [ 19 ]: a = ( 1 , 2 , 3 ,[ 'a' , 'b' , 'd' , 'e' ]) In [ 20 ]: type (a) Out[ 20 ]: tuple In [ 21 ]: id (a) Out[ 21 ]: 140347105497608 In [ 22 ]: a[ 3 ][ 2 ] = 5 In [ 23 ]: print a ( 1 , 2 , 3 , [ 'a' , 'b' , 5 , 'e' ]) In [ 24 ]: id (a) Out[ 24 ]: 140347105497608 |
适用于所有序列的操作和方法:
s + r:连接
s * n:制作s的n个副本,n为整数
value1,value2...valuen = s:变量解包
s[i]:索引运算符,返回一个序列的元素i
s[i:j]:切片运算符,返回一个切片
s[i:j:stride]:扩展切片运算符,返回一个扩展切片
对于切片运算,切片后的结果会生成为新对象
x in s,x not in s:从属关系
for x in s:迭代
len(s):返回s中的元素个数
min(s):返回s中的最小值
max(s):返回s中的最大值
min(s)和max(s)只适用于能够对元素排序的序列
sum(s [, initial]):只适用于数字序列,返回s中各项的和
all(s):检查s中的所有项是否为True
any(s):检查s中的任意项是否为True
适用于可变序列的操作:
s[i] = v 项目赋值
s[i:j] = t 切片赋值
s[i:j:stride] = t 扩展切片赋值
del s[i] 项目剔除
del s[i:j] 切片剔除
del s[i:j:stride] 扩展切片剔除
适用于列表的方法:
list(s)可将任意可迭代类型转换为列表,而如果s已经是一个列表,则该函数构造的新列表是s的一个浅复制
list(s):将s转换为一个列表
s.append(x):将一个新元素x追加到s末尾
s.extend(t):将一个新元素t追加到s末尾
s.count(x):计算s中x的出现次数
s.index(x, [, start [, stop]]):当s[i] == x.start时返回最小的i,可选参数stop用于指定搜索的起始和结束索引
s.insert(i,x):在索引i处插入x
s.pop([i]):返回元素i并从列表中移除它。如果省略i,则返回列表中最后一个元素并从列表中移除它
s.remove(x):搜索x并从s中移除它
s.reverse():颠倒s中的所有元素的顺序
s.sort([key [, reverse]]):对s中的所有元素进行排序。key是一个键函数。reverse是一个标志,表明以倒序对列表进行排序。key和reverse应该始终以关键字参数的形式指定
python数据类型之字典:dict
字典在其它编程语言中又称作关联数组或散列表。
在python中,字典属于可变类型的容器,其长度可变,与列表不同的地方在于它的元素是无序的,只能通过键来实现元素存取。
序列类型的键只能是数字下标,而字典的键可以是任意可hash类型,不过一般使用字符串当作其键
支持异构和任意嵌套
字典支持的操作与方法:
{}:定义一个空字典
{key1:value1,key2:value2,...}:定义字典
{'x':32,'y':[1,2,3]}:定义一个异构字典
d1 = dict(name='tom',age=42,gender='n'):用dict定义一个字典
d1= dict(zip('xyz','123')):用dict结合zip定义一个字典,此字典d1的结果为{'x':1,'y':2,'z':3}
d2 = d1.copy():字典复制
d.get(key):若key在字典d中存在,则返回key的值,否则返回空值
d[key]:若key在字典d中存在,则返回key的值,否则抛出异常
d.items():把字典d中的键值对返回成元组列表。将字典转换成元组列表
d.has_key(key):判断字典d中是否存在key
d.keys():返回字典d中的键列表
d.values():返回字典d中的值列表
d.pop(key):弹出指定的key
d.popitem():随机弹出键值映射
d1.update(d2):将字典d2合并到字典d1中,合并时若有键相同,则覆盖原字典中对应的键
d.iteritems():以键值对做为条目进行迭代,返回一个迭代器对象
d.iterkeys():以键做条目进行迭代,返回一个迭代器对象
d.itervalues():以值做条目进行迭代,返回一个迭代器对象
d.viewitems():返回类似集合风格的字典,以键值对的元组形式显示字典构造。返回的结果类似dict.items([(key,value),(key,value),(key,value)...])
d.viewkeys():返回类似集合风格的key列表。返回的结果类似dict.keys([key1,key2,key3....])
d.viewvalues():返回类似集合风格的value列表。返回的结果类似dict.values([value1,value2,value3....])
python数据类型之集合:set
集合就是指一大堆的不重复的元素放到一起,是一组无序排列的可hash的值。
支持集合关系测试:
并集
交集
差集
支持成员关系测试:
in
not in
支持迭代、异构
不支持索引、元素获取、切片
集合的类型:
set():可变对象
frozenset():不可变对象
集合没有特定语法格式,可以通过以下方法创建:
1.通过工厂函数(set()、frozenset())创建
2.通过{}创建,如s1 = {1,2,3,4,5,6}
集合类型支持的方法和操作:
s1 = set([1,2,3]):定义一个set集合。其参数必须是一个可迭代对象,可以是字符串、列表等
len(s):返回s中的项目数
max(s):返回s中的最大元素
min(s):返回s中的最小元素
s.copy():制作s的一份副本
s.difference(t):求差集。返回所有在s中,但不在t中的项目
s.intersection(t):求交集。返回所有同时在s和t中的项目
s.isdisjoint(t):如果s和t没有相同项,则返回True
s.issubset(t):如果s是t的一个子集,则返回True
s.issuperset(t):如果s是t的一个超集,则返回True
s.symmetric_difference(t):求对称差集。返回所有在s或t中,但又不同时在这两个集合中的项
s.union(t):求并集。返回所有在s或t中的项
s.pop():随机弹出一个项目
s.add(i):在s集合中添加一个元素i
s | t:求s和t的并集
s & t:求s和t的交集
s - t:求差集
s ^ t:求对称差集
容器、类型、对象的相关概念:
列表、元组、字典字面量可以在不使用续行符的情况下直接分布在多行上。最后一个元素后面允许使用一个逗号,但是没有元素时不允许使用逗号。
所有对象都有引用技术,为对象分配一个新名称(用一个变量名引用它)或者将一个对象放进一个容器中时,都会导致对象引用技术增加。
当对象引用技术为0时,就会由垃圾回收器回收此对象。使用del语句执行删除操作或者某次引用的修改超出当前对象的作用域时,对象的引用技术就会减少。
可以使用sys模块的getrefcount()函数来查看对象的引用技术:
1 2 3 4 5 6 | In [ 28 ]: import sys In [ 29 ]: a = 'black' In [ 30 ]: sys.getrefcount(a) Out[ 30 ]: 3 |
列表和字典都支持两种类型的复制操作:浅复制和深复制。深复制可使用copy模块中的deepcopy()实现。
python中的所有对象都是"第一类的"。第一类就意味着,使用标识符命名的所有对象,都具有相同状态。因此,能够命名的所有对象,都可以当作数据直接处理。
序列表示索引为非负整数的有序对象集合,包括字符串、列表和元组。所有序列都支持迭代。
字符串是字符的序列;
列表和元组是任意python对象的序列