pandas的基础知识(1)

2024-10-13 20:20:33

1、加载numpy和pandas,pandas中的DataFrame,Series。列表生成DataFrame。df=DataFrame([21,35,26,19,30],columns=['Age'],index=list('abcde'))表示用列表[21,35,26,19,30]生成一个DataFrame命名为df,df的列名为'Age',df的索引为'abcde';df.index和df.columns来查看df的索引和列名;如图所示

pandas的基础知识(1)

3、df的统计计算、表达式、向量化操作。df.sum()、df.max()、df.abs()分别对df求和、求最大值、求绝对值;df.apply(lambda x:x**2+1)、df**2+1都是对df的每个元素进行平方再加1的操作,结果相同;如图所示

pandas的基础知识(1)

4、df新增列的操作。使用元组新增df的一列,命名为‘Salary’。例如:df['Salary']=(6000,15000,8000,5000,12000);使用DataFrame新增df的一列,命名为‘Name’。例如:DataFrame(['Zhang San','Li Si','Wang Wu','Zhao Liu','Chen Qi'],index=list('bcdea')),此时'Name'的数据会根据索引自动匹配数据;如图所示

pandas的基础知识(1)

6、两个DataFrame的连接(合并)。df.join(DataFrame(职邗珩垃[1,2,3,4,5,6],index=list('abcdxy'),columns=['buys'])表示df和列名为‘buys’的DataFrame连接,由于join默认是‘left’,所以索引为y的值被舍弃了;df=df.join(DataFrame([1,2,3,4,5,6],index=list('abcdxy'),columns=['buys']),how='outer')表示使用‘out’连接,取得是并集,显示了所有值;如图所示

pandas的基础知识(1)
猜你喜欢