如何使用groupby()函数对DataFrame进行分组并计算"Grade"列的均值?
求教 groupby() 函数分组统计均值
给定如下 dataframe df:
df = pd.dataframe({‘major’:[‘math’,’physics’,’math’,’math’,’physics’,’math’,’math’,’physics’,’demograghy’],’grade’:[‘3′,’2′,’2′,’1′,’1′,’3′,’3′,’2′,’2′],’age’:[20,18,19,21,20,19,19,18,20]})
现希望利用 groupby() 函数按照 “major” 列分组,并计算 “grade” 列的均值。最终结果应如下所示:
grade 1 3majordemography<br>math<br>pyhsics
解决方案:
要实现上述需求,可以设置 groupby() 函数的参数如下:
df.groupby(["Major"]).mean("Grade")
步骤解析:
groupby([“major”]):按照 “major” 列分组,返回一个 dataframegroupby 对象。mean(“grade”):在分组对象上计算 “grade” 列的均值。
最终,groupby([“major”]).mean(“grade”) 会返回一个新的 dataframe,其中 “grade” 列的值为分组后的均值。
以上就是如何使用 groupby() 函数对 DataFrame 进行分组并计算 "Grade" 列的均值?的详细内容,更多请关注范的资源库其它相关文章!