1.聚合运算
(1)使用内置的聚合运算函数进行计算
1>内置的聚合运算函数
sum(),mean(),max(),min(),size(),describe()...等等
2>应用聚合运算函数进行计算
import numpy as np import pandas as pd #创建df对象 dict_data = { 'key1':['a','b','c','d','a','b','c','d'], 'key2':['one','two','three','one','two','three','one','two'], 'data1':np.random.randint(1,10,8), 'data2':np.random.randint(1,10,8) } df = pd.DataFrame(dict_data) print(df) ''' data1 data2 key1 key2 0 3 4 a one 1 7 9 b two 2 5 7 c three 3 3 4 d one 4 8 7 a two 5 4 7 b three 6 8 9 c one 7 4 4 d two ''' #根据key1分组,进行sum()运算 df = df.groupby('key1').sum() print(df) ''' key1 a 12 10 b 8 5 c 8 11 d 16 13 ''' #内置的聚合函数 print(df.groupby('key1').sum()) print('*'*50) print(df.groupby('key1').max()) print('*'*50) print(df.groupby('key1').min()) print('*'*50) print(df.groupby('key1').mean()) print('*'*50) print(df.groupby('key1').size()) print('*'*50) #分组中非Nan数据的数量 print(df.groupby('key1').count()) print('*'*50) print(df.groupby('key1').describe())
(2)自定义聚合函数进行计算
在使用自定义聚合函数的时候,需要用到一个agg()函数
#自定义聚合函数 #最大值-最小值 def peak_range(df): #返回数据范围差值 return df.max()**2 - df.min()**2 #agg() 可以将聚合计算的结果祖闯成一个dataframe对象返回 print(df.groupby('key1').agg(peak_range)) #lambda print(df.groupby('key1').agg(lambda df:df.max()-df.min()))
(3)应用多个聚合函数,默认列索引为函数名
#应用多个聚合函数,默认列索引为函数名 #通过元素重新命名列索引('列索引',函数) print(df.groupby('key1').agg(['sum','std','mean',('range',peak_range)])) ''' data1 data2 sum std mean range sum std mean range key1 a 10 2.828427 5.0 40 12 2.828427 6.0 48 b 10 5.656854 5.0 80 8 1.414214 4.0 16 c 6 1.414214 3.0 12 9 0.707107 4.5 9 d 15 0.707107 7.5 15 8 2.828427 4.0 32 '''
(4)指定每一列使用某个聚合运算函数
#指定每一列使用某个聚合运算函数 print(df.groupby('key1').agg({'data1':'mean','data2':'sum'})) ''' data1 data2 key1 a 5.0 12 b 5.0 8 c 3.0 9 d 7.5 8 '''
2.分组运算
(1)进行分组运算,并在运算后的结果列索引前加前缀
加前缀用到add_prefix('前缀')函数
#创建df对象 dict_data = { 'key1':['a','b','c','d','a','b','c','d'], 'key2':['one','two','three','one','two','three','one','two'], 'data1':np.random.randint(1,10,8), 'data2':np.random.randint(1,10,8) } df = pd.DataFrame(dict_data) print(df) ''' data1 data2 key1 key2 0 1 5 a one 1 9 3 b two 2 3 6 c three 3 6 9 d one 4 8 4 a two 5 5 5 b three 6 9 6 c one 7 4 1 d two ''' #按照key1分组,进行sum()运算 #在运算结果的列索引前添加前缀 k1_sum = df.groupby('key1').sum().add_prefix('sum_') print(k1_sum) ''' sum_data1 sum_data2 key1 a 9 9 b 14 8 c 12 12 d 10 10 '''
(2)进行分组运算,并把原始数据和结果数据合并
#创建df对象 dict_data = { 'key1':['a','b','c','d','a','b','c','d'], 'key2':['one','two','three','one','two','three','one','two'], 'data1':np.random.randint(1,10,8), 'data2':np.random.randint(1,10,8) } df = pd.DataFrame(dict_data) print(df) ''' data1 data2 key1 key2 0 1 5 a one 1 9 3 b two 2 3 6 c three 3 6 9 d one 4 8 4 a two 5 5 5 b three 6 9 6 c one 7 4 1 d two ''' #按照key1分组,进行sum()运算 #在运算结果的列索引前添加前缀 k1_sum = df.groupby('key1').sum().add_prefix('sum_') print(k1_sum) ''' sum_data1 sum_data2 key1 a 9 9 b 14 8 c 12 12 d 10 10 ''' #将运算结果和原始数据拼接到一起 #参数1:原始数据 #参数2:运算结果数据 pd.merge(df,k1_sum,left_on='key1',right_index=True)
(3)使用transform()函数,将计算结果按照原始数据排序成一个DataFrame对象
#创建df对象 dict_data = { 'key1':['a','b','c','d','a','b','c','d'], 'key2':['one','two','three','one','two','three','one','two'], 'data1':np.random.randint(1,10,8), 'data2':np.random.randint(1,10,8) } df = pd.DataFrame(dict_data) print(df) ''' data1 data2 key1 key2 0 1 5 a one 1 9 3 b two 2 3 6 c three 3 6 9 d one 4 8 4 a two 5 5 5 b three 6 9 6 c one 7 4 1 d two ''' #按照key1分组,进行sum()运算 #在运算结果的列索引前添加前缀 k1_sum = df.groupby('key1').sum().add_prefix('sum_') print(k1_sum) ''' sum_data1 sum_data2 key1 a 9 9 b 14 8 c 12 12 d 10 10 ''' #transform() 计算 会将计算的结果按照原始数据的排序组装成一个dataframe对象 k1_sum_tf = df.groupby('key1').transform(np.sum).add_prefix('sum_') # print(k1_sum_tf.columns) #把运算结果数据拼接到原始数据后 df[k1_sum_tf.columns] = k1_sum_tf print(df) ''' data1 data2 key1 key2 sum_data1 sum_data2 sum_key2 0 5 4 a one 9 12 onetwo 1 3 3 b two 5 12 twothree 2 9 2 c three 14 9 threeone 3 6 5 d one 11 9 onetwo 4 4 8 a two 9 12 onetwo 5 2 9 b three 5 12 twothree 6 5 7 c one 14 9 threeone 7 5 4 d two 11 9 onetwo '''
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
《魔兽世界》大逃杀!60人新游玩模式《强袭风暴》3月21日上线
暴雪近日发布了《魔兽世界》10.2.6 更新内容,新游玩模式《强袭风暴》即将于3月21 日在亚服上线,届时玩家将前往阿拉希高地展开一场 60 人大逃杀对战。
艾泽拉斯的冒险者已经征服了艾泽拉斯的大地及遥远的彼岸。他们在对抗世界上最致命的敌人时展现出过人的手腕,并且成功阻止终结宇宙等级的威胁。当他们在为即将于《魔兽世界》资料片《地心之战》中来袭的萨拉塔斯势力做战斗准备时,他们还需要在熟悉的阿拉希高地面对一个全新的敌人──那就是彼此。在《巨龙崛起》10.2.6 更新的《强袭风暴》中,玩家将会进入一个全新的海盗主题大逃杀式限时活动,其中包含极高的风险和史诗级的奖励。
《强袭风暴》不是普通的战场,作为一个独立于主游戏之外的活动,玩家可以用大逃杀的风格来体验《魔兽世界》,不分职业、不分装备(除了你在赛局中捡到的),光是技巧和战略的强弱之分就能决定出谁才是能坚持到最后的赢家。本次活动将会开放单人和双人模式,玩家在加入海盗主题的预赛大厅区域前,可以从强袭风暴角色画面新增好友。游玩游戏将可以累计名望轨迹,《巨龙崛起》和《魔兽世界:巫妖王之怒 经典版》的玩家都可以获得奖励。
更新日志
- 群星《前途海量 电影原声专辑》[FLAC/分轨][227.78MB]
- 张信哲.1992-知道新曲与精丫巨石】【WAV+CUE】
- 王翠玲.1995-ANGEL【新艺宝】【WAV+CUE】
- 景冈山.1996-我的眼里只有你【大地唱片】【WAV+CUE】
- 群星《八戒 电影原声带》[320K/MP3][188.97MB]
- 群星《我的阿勒泰 影视原声带》[320K/MP3][139.47MB]
- 纪钧瀚《胎教古典音乐 钢琴与大提琴的沉浸时光》[320K/MP3][148.91MB]
- 刘雅丽.2001-丽花皇后·EMI精选王【EMI百代】【FLAC分轨】
- 齐秦.1994-黄金十年1981-1990CHINA.TOUR.LIVE精丫上华】【WAV+CUE】
- 群星.2008-本色·百代音乐人创作专辑【EMI百代】【WAV+CUE】
- 群星.2001-同步过冬AVCD【环球】【WAV+CUE】
- 群星.2020-同步过冬2020冀待晴空【环球】【WAV+CUE】
- 沈雁.1986-四季(2012梦田复刻版)【白云唱片】【WAV+CUE】
- 纪钧瀚《胎教古典音乐 钢琴与大提琴的沉浸时光》[FLAC/分轨][257.88MB]
- 《国语老歌 怀旧篇 3CD》[WAV/分轨][1.6GB]