列表
1.1、列表的创建操作
1.1.1、创建空列表的两种方式
list001 = [] # 方式1:直接中括号创建,推荐使用这种方法创建
list001 = list() # 方式2:函数创建
1.1.2、初始化指定大小的列表
def initialize_2d_list(w, h, val=None):
"""
根据给定的长和宽,以及初始值,返回一个二维列表。
例:initialize_2d_list(2, 4) 结果:[[None, None], [None, None], [None, None], [None, None]]
:param w: int类型 列表每个元素的长度
:param h: int类型 列表的长度
:param val: obj类型 初始值,默认为None
:return: 二维列表
"""
return [[val for _ in range(w)] for _ in range(h)]
1.2、列表的添加操作
1.2.1、在列表的尾部添加(append方法)
list001 = []
# 将x追加至列表的尾部,不影响列表中已有元素的位置,也不影响列表在内存中的起始地址。
list001.append(100)
1.2.2、在指定的位置添加(insert方法)
list001 = []
# 在列表的index位置处插入x,该位置之后的所有元素自动向后移动,索引加1。
list001.insert(0, 111)
1.2.3、合并列表
1.2.3.1、用 extend() 方法进行合并
list001 = []
list002 = []
# 将list002中所有元素追加至list001的尾部,不影响list001列表中已有元素的位置,也不影响list001在内存中的起始地址。
list001.extend(list002) # 注意:改变的是list001,list002列表没有改变,还是原来的样子
1.2.3.2、直接相加进行合并
list001 = []
list002 = []
list003 = list001 + list002 # 注意:这种方法实际是得到一个新列表,原来的两个列表都没改变
1.2.3.3、用 sum() 函数合并
a = [1, 2, 3]
b = [4, 5, 6]
c = [7, 8, 9]
d = sum((a,b,c), [])
print(d) # 输出:[1, 2, 3, 4, 5, 6, 7, 8, 9]
1.2.3.4、两个列表合并成字典
def list2_to_dict(lst1, lst2):
"""
将两个列表合并成字典,将两个长度不等的列表合并为一个字典时,服从少数原则(相当于丢弃多余的元素)
例:list2_to_dict([1, 2], ['a', 'b', 'c']) 结果:{1: 'a', 2: 'b'}
"""
return dict(zip(lst1, lst2))
1.2.4、复制列表
1.2.4.1、浅拷贝列表
name = ["张三", "李四", "王五"]
student = ["小明", "小红", name]
# 生成列表的副本.注意:这实际上是浅拷贝,注意id值一样
student_01 = student.copy()
print(id(student[-1])) # 2277330399296
print(id(student_01[-1])) # 2277330399296
1.2.4.2、深拷贝列表
import copy
name = ["张三", "李四", "王五"]
student = ["小明", "小红", name]
# 生成列表的副本.注意:这是深度拷贝,注意id值不一样
deep_copy = copy.deepcopy(student)
print(id(student[-1])) # 2277330402176
print(id(deep_copy[-1])) # 2277330399936
1.3、列表的删除操作
1.3.1、根据索引进行删除
1.3.1.1、删除最后一个元素(pop方法)
students = ["张三", "李四", "王五", "赵六", "杰克", "汤姆", "小明"]
stu = students.pop() # 将最后一个元素删除,变量stu会接收被删除的值,及stu = "小明"
# 注意:pop()方法是有返回值的,返回的就是被删除的元素,pop(-1)和pop()等价,默认删除最后一个
1.3.1.2、删除指定索引的元素
students = ["张三", "李四", "王五", "赵六", "杰克", "汤姆", "小明"]
stu = students.pop(2) # 将索引是2的元素删除,变量stu会接收被删除的值,及stu = "王五"
1.3.2、根据元素进行删除
1.3.2.1、删除某一个元素(del方法)
students = ["张三", "李四", "王五", "赵六", "杰克", "汤姆", "小明"]
del students[0]
1.3.2.2、移除某一个元素(remove方法)
students = ["张三", "李四", "王五", "赵六", "杰克", "汤姆", "小明", "李四"]
# 删除第一次出现的 “李四” ,被删除的元素不存在,会抛出异常,
students.remove("李四") # 注意,此方法没有返回值,不能用变量去接收
1.3.2.3、根据索引列表批量删除对应位置的元素
def del_many_line(lst, index_lst):
"""根据给出的索引列表,批量删除对应位置的值"""
return [n for i, n in enumerate(lst) if i not in index_lst]
1.3.2.4、清空列表
age = [13, 15, 21, 17, 8, 39, 27, 24, 17]
age.clear()
1.4、列表的修改操作
students = ["张三", "李四", "王五", "赵六", "杰克", "汤姆", "小明", "李四"]
students[0] = "小红" # 将第一个位置的元素改为 “小红”, “张三” 被改为了 “小红”
1.5、列表的获取操作
1.5.1、获取元素的频率
1.5.1.1、使用 count() 方法获取元素的频率
students = ["张三", "李四", "王五", "赵六", "杰克", "汤姆", "小明", "李四"]
# 返回 “李四” 在学生列表中出现的次数
num = students.count("李四") # 注意:返回值是出现的次数
1.5.1.2、使用 Counter 类获取元素的频率
from collections import Counter
def coll_list(lst):
"""
对列表中各个元素出现的次数的统计
使用 Python Counter 类。Python 计数器跟踪容器中每个元素的频数, Counter()返回字典,元素作为键,频数作为值。
另外使用 most_common()函数来获取列表中的 出现次数最多的元素。
"""
count = Counter(lst)
# 返回列表中 b 元素出现的次数
print(count['b'])
# 返回列表中出现的次数最多的元素
print(count.most_common(1))
# 返回列表中出现的次数最多的头两个元素
print(count.most_common(2))
return count
1.5.2、获取元素的索引
1.5.2.1、获取某元素的索引(index方法)
students = ["张三", "李四", "王五", "赵六", "杰克", "汤姆", "小明", "李四"]
# 返回列表中第一个值为 “李四” (列表中有两个李四)的元素的索引,若不存在该元素则抛出异常。
index = studnets.index("李四") # 注意:返回值是索引
1.5.2.2、获取某元素的所有索引
def find_all_index(lst, target):
"""获取某一元素在列表中的所有位置,返回结果是一个索引列表"""
target_all_index = []
for i in range(len(lst)):
if lst[i] == target:
target_all_index.append(i)
return target_all_index
1.5.3、获取出现频率最多的元素
lst = ["张三", "李四", "王五", "小明", "杰克", "汤姆", "小明"]
def demo04(lst):
"""获取列表中出现次数最多的元素,如果每个元素都是唯一的,则会返回第一个元素"""
return max(lst, key=lst.count)
print(demo04(lst)) # 输出:小明
1.6、列表的排序操作
1.6.1、排序
1.6.1.1、使用自身的 sort() 方法进行排序
age = [13, 15, 21, 17, 8, 39, 27, 24, 17]
# 对列表中的元素进行原地排序,key用来指定排序规则,reverse为False(默认)表示升序,为True表示降序
age.sort() # 注意:此方法是对原列表进行排序,改变的是原列表
age.sort(reverse=True) # 降序
1.6.1.2、使用魔法方法 sorted() 进行排序
age = [13, 15, 21, 17, 8, 39, 27, 24, 17]
age1 = sorted(age) # 注意:sorted()是魔法方法,返回的是一个排序后的新列表,sort()方法是列表自带的方法
1.6.1.3、冒泡排序
list001 = [2, 1, 0, 4, 7, 6, 3, 8, 9, 5]
for i in range(len(list001) - 1):
for j in range(len(list001) - i - 1):
if list001[j] > list001[j + 1]:
list001[j], list001[j + 1] = list001[j + 1], list001[j]
print(list001)
1.6.1.4、两个列表联动排序
def demo01():
"""两个列表一一对应,将一个列表排序,要求另一个列表随之排序"""
list_name01 = ['郭靖', '杨过', '张无忌', '周伯通', '杨天宝', '成是非']
list_name02 = ['黄蓉', '小龙女', '赵敏', '瑛姑', '穆桂英', '云罗郡主']
zipped = zip(list_name01, list_name02) # 打包操作
# 排序,以序列list_name01为准基排序,得到对应的list_name02在list_name01的排序后的序列结果
# key=lambda 元素: 元素[字段索引],x:x[]字母可以随意修改,排序方式按照中括号[]里面的维度进行排序,[0]按照第一维排序,[2]按照第三维排序
variable = sorted(zipped, key=lambda x: x[0])
# 根据元组第0个值升序排序,若第0个值相等则根据第1个值升序排序
# variable = sorted(zipped, key=lambda x: (x[0], x[1]))
# 根据元组第0个值升序排序,若第0个值相等则根据第1个值降序排序
# variable = sorted(zipped, key=lambda x: (x[0], -x[1]))
result = zip(*variable) # 解包操作
# list_name01和list_name02没变
print(list(result)) # [('周伯通', '张无忌', '成是非', '杨天宝', '杨过', '郭靖'), ('瑛姑', '赵敏', '云罗郡主', '穆桂英', '小龙女', '蓉儿')]
return list(result)
1.6.2、倒序
1.6.2.1、使用列表自身的方法进行倒序(reverse方法)
age = [13, 15, 21, 17, 8, 39, 27, 24, 17]
age.reverse() # 注意:此方法是对原列表进行倒序(及反转列表),改变的是原列表
1.6.2.2、使用魔法方法进行倒序(reversed方法)
age = [13, 15, 21, 17, 8, 39, 27, 24, 17]
variable = reversed(age) # 注意:reversed()是魔法方法,返回的是一个倒序后的新列表,reverse()方法是列表自带的方法
1.6.2.3、使用切片方法进行倒序
age = [13, 15, 21, 17, 8, 39, 27, 24, 17]
age1 = age[::-1] # 注意:这种方法没有改变原列表,返回的是一个新列表
1.7、列表的常见操作
1.7.1、遍历列表
1.7.1.1、使用 enumerate() 遍历列表
students = ["张三", "李四", "王五", "赵六", "杰克", "汤姆", "小明", "李四"]
for index, value in students:
print(index, value)
1.7.1.2、倒序遍历列表
# 倒序遍历一个List:
for x in reversed(array):
print(x)
for x in range(len(array)-1,-1,-1):
print(array[x])
1.7.2、分割列表
1.7.2.1、根据需要的大小分割列表
from math import ceil
def chunk(lst, size):
"""
对一个列表根据所需要的大小进行细分
例:chunk([1, 2, 3, 4, 5, 6, 7, 8, 9, 0], 3) 结果:[[1, 2, 3], [4, 5, 6], [7, 8, 9], [0]]
:param lst:
:param size:
:return:
"""
return list(map(lambda x: lst[x * size:x * size + size], list(range(0, int(ceil(len(lst) / size))))))
1.7.2.2、根据列表中的某一个元素进行分割
from itertools import groupby
def according_to_element(lst, element):
"""
根据列表中的某一个元素进行分割列表
例子:
["张三","李四", "aa", "王五", "赵六", "小明", "aa", "杰克", "汤姆", "aa", "小兰", "熊二", "熊大", "aa"]
根据 aa 这个元素进行分割,得到
[['张三', '李四'], ['王五', '赵六', '小明'], ['杰克', '汤姆'], ['小兰', '熊二', '熊大']]
"""
return [list(g) for k, g in groupby(lst, lambda x: x == element) if not k]
1.7.2.3、根据返回True或False来分割归类
def bifurcate_by(lst, fn):
"""
使用一个函数应用到一个列表的每个元素上,使这个列表被切割成两部分。如果说,函数应用到元素上返回值为True,则该元素被切割到第一部分,否则分到第二部分。
例:bifurcate_by(['beep', 'bop', 'foo', 'bar'], lambda x: x[0] == 'b'),结果:[['beep', 'bop', 'bar'], ['foo']]
:param lst:
:param fn:
:return:
"""
return [[x for x in lst if fn(x)], [x for x in lst if not fn(x)]]
1.7.3、展开列表
1.7.3.1、嵌套深度只有一层进行展开
def expand_list3(lst):
"""展开列表清单,如果嵌套列表的深度只有1层,并且只想把所有元素放在一个普通列表中,可以通过下面的方法得到数据"""
return [item for sublist in lst for item in sublist]
1.7.3.2、不知道嵌套深度进行展开
from iteration_utilities import deepflatten # pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ iteration_utilities
def expand_list2(lst):
"""展开列表清单,不知道列表嵌套深度,只想把所有元素放在一个列表中,可以通过下面的方法得到数据(使用第三方包实现)"""
return list(deepflatten(lst))
1.7.3.3、使用递归方法进行展开
def expand_list(lst):
"""展开列表清单,如果不知道列表嵌套深度,并且只想把所有元素放在一个普通列表中,可以通过下面的方法得到数据(使用递归法实现,比较通用,推荐)"""
if lst is None:
lst = []
res = []
for ys in lst:
if isinstance(ys, list):
res.extend(expand_list(ys))
else:
res.append(ys)
return res
1.7.4、清理列表
1.7.4.1、去除无用字符串、空字符串等等
def remove_useless_characters(lst):
"""
去除无用字符,空字符串等等
例:remove_useless_characters(['', '\t', '\n', '\r', '\v', '\f', ' n ', 'abc ', ' '])
结果:['n', 'abc']
"""
return [x.strip() for x in lst if x.strip() != '']
1.7.4.2、去除错误值
def compact(lst):
"""
使用 filter() 删除列表中的错误值(如:False, None, 0 和 '')
例:compact([None, 0, 1, False, ' ', 2, "", 3, 'a', 's', 34]) 结果:[1, ' ', 2, 3, 'a', 's', 34]
"""
return list(filter(bool, lst))
1.7.5、列表去重
1.7.5.1、推荐的去重方式
citys = ['上海', '广州', '上海', '成都', '上海', '上海', '北京', '上海', '广州', '北京', '上海']
def remove_duplication(lst):
"""列表去重并且不改变原来元素的位置"""
format_list = list(set(lst))
format_list.sort(key=lst.index)
return format_list
print(remove_duplication(citys)) # ['上海', '广州', '成都', '北京']
1.7.5.2、通过for循环去重
# 通过for循环(不会改变原列表)
citys = ['上海', '广州', '上海', '成都', '上海', '上海', '北京', '上海', '广州', '北京', '上海']
ncity = []
for item in citys:
if item not in ncity:
ncity.append(item)
print(ncity) # ['上海', '广州', '成都', '北京']
1.7.5.3、通过set方法去重
# set方法(改变原来顺序)
citys = ['上海', '广州', '上海', '成都', '上海', '上海', '北京', '上海', '广州', '北京', '上海']
ncitx=list(set(citys))
print(ncitx) # ['成都', '上海', '广州', '北京']
1.7.5.4、通过count()方法统计并删除进行去重
# count()方法统计并删除,需要先排序(改变原来顺序)
citys = ['上海', '广州', '上海', '成都', '上海', '上海', '北京', '上海', '广州', '北京', '上海']
citys.sort()
for x in citys:
while citys.count(x)>1:
del citys[citys.index(x)]
print(citys) # ['上海', '北京', '广州', '成都']
1.7.5.5、通过转成字典的方式去重
# 把列表转成字典,利用字典键唯一的特性去重
citys = ['上海', '广州', '上海', '成都', '上海', '上海', '北京', '上海', '广州', '北京', '上海']
mylist = list({}.fromkeys(citys).keys())
print(mylist) # ['上海', '广州', '成都', '北京']
1.8、常见使用场景
1.8.1、列表随机取样
import random
import secrets
def random_list1(lst, ns):
"""从列表中随机取样,下面代码从给定列表中生成了 n 个随机样本"""
samples = random.sample(lst, ns)
return samples
def random_list2(lst, ns):
"""使用secrets库生成随机样本"""
s_rand = secrets.SystemRandom()
samples = s_rand.sample(lst, ns)
return samples
1.8.2、将列表中的连续数据归类
def find_consecutive(lst):
"""
在列表中找到连续的数据
"""
lst01 = []
lst02 = []
for x in sorted(set(lst)):
lst01.append(x)
if x + 1 not in lst:
if len(lst01) != 1:
lst02.append(lst01)
else:
lst02.append(lst01)
lst01 = []
return lst02
1.8.3、数字按个、十、百、千位进行分割
def digitize(n):
"""
将整形数字n转化为字符串后,还自动对该字符串进行了序列化分割,最后将元素应用到map的第一个参数中,转化为整形后返回
例:digitize(123) 结果:[1, 2, 3]
:param n:
:return:
"""
return list(map(int, str(n)))
1.8.4、判断数字和哪个边界值离的近
def clamp_number(num, a, b):
"""
如果 num 落在 [a,b]数字范围内,则返回num,否则返回离这个范围最近的边界
例:clamp_number(2, 3, 10) 结果:3
例:clamp_number(7, 3, 10) 结果:7
例:clamp_number(20, 3, 10) 结果:10
"""
return max(min(num, max(a, b)), min(a, b))
1.8.5、斐波拉契数列
def fibonacci(n):
"""非递归斐波那契"""
if n <= 0:
return [0]
sequence = [0, 1]
while len(sequence) <= n:
a = sequence[len(sequence) - 1]
b = sequence[len(sequence) - 2]
next_value = (a + b)
sequence.append(next_value)
return sequence
1.8.6、相同的键,对值求和
def sum_by(lst, fn):
"""
对列表中的各个字典里相同键值的对象求和。
例:sum_by([{'n': 4}, {'n': 2}, {'n': 8}], lambda v: v['n']) 结果:14
:param lst:
:param fn:
:return:
"""
return sum(map(fn, lst))
1.8.7、找一个列表的所有子集
from itertools import combinations
students = ["张三", "李四", "王五", "赵六", "杰克", "汤姆", "小明"]
def demo01():
"""使用 itertools 中的 combinations 函数来查找一个集合的所有子集"""
return list(combinations(students, 2))