Python提取列的不重复数据
1、导入包
import pandas as pd
2、获取示例文件,提取数据
df = pd.read_excel(r"C:\Users\zhang\Desktop\合并0929.xlsx",sheet_name="合并")
df = df.loc[:,["平台","合计"]]
print(df)
获取的数据共有3695行

3、提取列数据转换成列表
a = df["平台"].tolist()
len(a)
列表长度为3695

4、将列表转换成集合
b = set(a)
去重后数据长度为15
集合内是不能存在重复值,达到了去重的目的

5、最后将集合转换成列表
c = list(b)

6、这几条可以写在一行里
list(set(df["平台"].tolist()))

阅读量:93
阅读量:159
阅读量:50
阅读量:108
阅读量:81