• <legend id='7LLE0'><style id='7LLE0'><dir id='7LLE0'><q id='7LLE0'></q></dir></style></legend>

    1. <small id='7LLE0'></small><noframes id='7LLE0'>

        <i id='7LLE0'><tr id='7LLE0'><dt id='7LLE0'><q id='7LLE0'><span id='7LLE0'><b id='7LLE0'><form id='7LLE0'><ins id='7LLE0'></ins><ul id='7LLE0'></ul><sub id='7LLE0'></sub></form><legend id='7LLE0'></legend><bdo id='7LLE0'><pre id='7LLE0'><center id='7LLE0'></center></pre></bdo></b><th id='7LLE0'></th></span></q></dt></tr></i><div id='7LLE0'><tfoot id='7LLE0'></tfoot><dl id='7LLE0'><fieldset id='7LLE0'></fieldset></dl></div>
          <bdo id='7LLE0'></bdo><ul id='7LLE0'></ul>
      1. <tfoot id='7LLE0'></tfoot>

        如何将groupby()和value_count()转换为多个饼图/条形图

        How to turn groupby() and value_counts() into multiple pie/bar charts(如何将groupby()和value_count()转换为多个饼图/条形图)

        1. <i id='NzQ3x'><tr id='NzQ3x'><dt id='NzQ3x'><q id='NzQ3x'><span id='NzQ3x'><b id='NzQ3x'><form id='NzQ3x'><ins id='NzQ3x'></ins><ul id='NzQ3x'></ul><sub id='NzQ3x'></sub></form><legend id='NzQ3x'></legend><bdo id='NzQ3x'><pre id='NzQ3x'><center id='NzQ3x'></center></pre></bdo></b><th id='NzQ3x'></th></span></q></dt></tr></i><div id='NzQ3x'><tfoot id='NzQ3x'></tfoot><dl id='NzQ3x'><fieldset id='NzQ3x'></fieldset></dl></div>

          <small id='NzQ3x'></small><noframes id='NzQ3x'>

          <legend id='NzQ3x'><style id='NzQ3x'><dir id='NzQ3x'><q id='NzQ3x'></q></dir></style></legend>
            <tbody id='NzQ3x'></tbody>

            • <bdo id='NzQ3x'></bdo><ul id='NzQ3x'></ul>
                1. <tfoot id='NzQ3x'></tfoot>
                2. 本文介绍了如何将groupby()和value_count()转换为多个饼图/条形图的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着跟版网的小编来一起学习吧!

                  问题描述

                  假设我有一个数据帧,并且我正在查看其中的2列(2个系列)。

                  使用下面的其中一列--"no_employees"--有人能帮我弄清楚如何创建6个不同的饼图或条形图(每个NO_Employees组1个)来说明处理列中的Yes/No值的值计数吗?我将使用matplotlibseaborn,只要您觉得最简单。

                  我使用附加的代码行生成下面的代码。

                  dataframe_title.groupby(['no_employees']).treatment.value_counts(). 
                  

                  但现在我被卡住了。我要使用seaborn吗?.plot?这看起来应该很简单,我知道在某些情况下我可以做出subplots=True,但是我真的很困惑。非常感谢。

                  no_employees    treatment
                  1-5             Yes           88
                                  No            71
                  100-500         Yes           95
                                  No            80
                  26-100          Yes          149
                                  No           139
                  500-1000        No            33
                                  Yes           27
                  6-25            No           162
                                  Yes          127
                  More than 1000  Yes          146
                                  No           135
                  

                  推荐答案

                  数据编码的重要性:
                  1. 数据可视化的目的是为了更容易地传达信息(例如,在本例中是每个类别的'treatments'的相对数量)
                  2. 条形图便于显示重要信息
                    • 每组有多少人说'Yes''No'
                    • 每个组的相对大小
                  3. 饼图更常用于显示样本,其中样本中的组总和为100%。
                    • Wikipedia: Pie Chart
                      • 研究表明,按角度比较不如按长度比较准确,因为人们辨别差异的能力较差。
                      • Statisticians一般认为饼图是一种很差的信息显示方式,在科学文献中并不常见。
                    • 此数据不能用饼图很好地表示,因为每个公司规模都是单独的总体,这将需要正确表示6个饼图
                    • 可以将数据放入饼图(如其他人所示),但这并不意味着应该将其放入饼图中。
                  • 无论绘图类型如何,数据的形状对于绘图API都必须正确。
                  • 使用pandas 1.3.0seaborn 0.11.1matplotlib 3.4.2
                  • 测试

                  设置测试数据帧

                  import pandas as pd
                  import seaborn as sns
                  import matplotlib.pyplot as plt
                  import numpy as np  # for sample data only
                  
                  np.random.seed(365)
                  cats = ['1-5', '6-25', '26-100', '100-500', '500-1000', '>1000']
                  
                  data = {'no_employees': np.random.choice(cats, size=(1000,)),
                          'treatment': np.random.choice(['Yes', 'No'], size=(1000,))}
                  
                  df = pd.DataFrame(data)
                  
                  # set a categorical order for the x-axis to be ordered
                  df.no_employees = pd.Categorical(df.no_employees, categories=cats, ordered=True)
                  
                    no_employees treatment
                  0       26-100        No
                  1          1-5       Yes
                  2        >1000        No
                  3      100-500       Yes
                  4     500-1000       Yes
                  

                  pandas.DataFrame.plot()的id="plotting-with-pandas.dataframe.plot-l84f">Plotting:

                  • 这需要将数据帧分组以获取.value_counts,并使用pandas.DataFrame.unstack进行出栈。
                  # to get the dataframe in the correct shape, unstack the groupby result
                  dfu = df.groupby(['no_employees']).treatment.value_counts().unstack()
                  
                  treatment     No  Yes
                  no_employees         
                  1-5           78   72
                  6-25          83   86
                  26-100        83   76
                  100-500       91   84
                  500-1000      78   83
                  >1000         95   91
                  
                  # plot
                  ax = dfu.plot(kind='bar', figsize=(7, 5), xlabel='Number of Employees in Company', ylabel='Count', rot=0)
                  ax.legend(title='treatment', bbox_to_anchor=(1, 1), loc='upper left')
                  


                  使用seaborn

                  打印
                  • seaborn是matplotlib的高级接口
                  seaborn.barplot()
                  • 需要整洁(长)格式的DataFrame,方法是将DataFrame分组以获取.value_counts,然后使用pandas.Series.reset_index
                  • 重置索引
                  • 也可以使用sns.catplot()kind='bar'进行图形级界面操作
                  # groupby, get value_counts, and reset the index
                  dft = df.groupby(['no_employees']).treatment.value_counts().reset_index(name='Count')
                  
                     no_employees treatment  Count
                  0           1-5        No     78
                  1           1-5       Yes     72
                  2          6-25       Yes     86
                  3          6-25        No     83
                  4        26-100        No     83
                  5        26-100       Yes     76
                  6       100-500        No     91
                  7       100-500       Yes     84
                  8      500-1000       Yes     83
                  9      500-1000        No     78
                  10        >1000        No     95
                  11        >1000       Yes     91
                  
                  # plot
                  p = sns.barplot(x='no_employees', y='Count', data=dft, hue='treatment')
                  p.legend(title='treatment', bbox_to_anchor=(1, 1), loc='upper left')
                  p.set(xlabel='Number of Employees in Company')
                  
                  seaborn.countplot()
                  • 使用原始数据帧df,不进行任何转换。
                  • 也可以使用sns.catplot()kind='count'进行图形级界面操作
                  p = sns.countplot(data=df, x='no_employees', hue='treatment')
                  p.legend(title='treatment', bbox_to_anchor=(1, 1), loc='upper left')
                  p.set(xlabel='Number of Employees in Company')
                  
                  • barplotcountplot的输出

                  这篇关于如何将groupby()和value_count()转换为多个饼图/条形图的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持跟版网!

                  本站部分内容来源互联网,如果有图片或者内容侵犯了您的权益,请联系我们,我们会在确认后第一时间进行删除!

                  相关文档推荐

                  groupby multiple coords along a single dimension in xarray(在xarray中按单个维度的多个坐标分组)
                  Group by and Sum in Pandas without losing columns(Pandas中的GROUP BY AND SUM不丢失列)
                  Is there a way of group by month in Pandas starting at specific day number?( pandas 有从特定日期开始的按月分组的方式吗?)
                  Group by + New Column + Grab value former row based on conditionals(GROUP BY+新列+基于条件的前一行抓取值)
                  Groupby and interpolate in Pandas(PANDA中的Groupby算法和插值算法)
                  Pandas - Group Rows based on a column and replace NaN with non-null values(PANAS-基于列对行进行分组,并将NaN替换为非空值)
                3. <legend id='OI1q0'><style id='OI1q0'><dir id='OI1q0'><q id='OI1q0'></q></dir></style></legend>

                      <tbody id='OI1q0'></tbody>
                    <i id='OI1q0'><tr id='OI1q0'><dt id='OI1q0'><q id='OI1q0'><span id='OI1q0'><b id='OI1q0'><form id='OI1q0'><ins id='OI1q0'></ins><ul id='OI1q0'></ul><sub id='OI1q0'></sub></form><legend id='OI1q0'></legend><bdo id='OI1q0'><pre id='OI1q0'><center id='OI1q0'></center></pre></bdo></b><th id='OI1q0'></th></span></q></dt></tr></i><div id='OI1q0'><tfoot id='OI1q0'></tfoot><dl id='OI1q0'><fieldset id='OI1q0'></fieldset></dl></div>

                          <small id='OI1q0'></small><noframes id='OI1q0'>

                          • <bdo id='OI1q0'></bdo><ul id='OI1q0'></ul>
                            <tfoot id='OI1q0'></tfoot>