Pandas dataframe - Rearranging row index values into column headers

Question

am trying to get from the following dataframe:

          DAY    Col1    ColA    ColB    ColC
    ID    
    ABC   Mon    A        123
    DEF   Mon    A        456
    GHI   Mon    A        789
    ABC   Tue    A                123
    DEF   Tue    A                456
    GHI   Tue    A                789
    ABC   Wed    A                        123
    DEF   Wed    A                        456
    GHI   Wed    A                        789

into:

    ID    Mon    Tue    Wed
    ABC   123    123    123
    DEF   456    456    456
    GHI   789    789    789

So the idea would be to remove the empty cells, and reclassify the columns into unique Days followed by the ID's corresponding value in that Day.

Appreciate any help I get, thanks!

jezrael · Accepted Answer · 2018-03-22 07:28:21Z

1

You can use:

df = (df.drop('Col1', 1)
        .set_index(['ID','DAY'])
        .stack()
        .reset_index(level=2, drop=True)
        .unstack())
print (df)
DAY    Mon    Tue    Wed
ID                      
ABC  123.0  123.0  123.0
DEF  456.0  456.0  456.0
GHI  789.0  789.0  789.0

Explanation:

Remove unnecessary column Col1 by drop
Create index by set_index
Reshape by stack for remove NaNs and columns names to MultiIndex
Remove 2 level of MultiIndex by reset_index
Reshape by unstack

EDIT:

df = (df.drop('Col1', 1)
        .set_index('DAY', append=True)
        .stack()
        .reset_index(level=2, drop=True)
        .unstack()
        )
print (df)
DAY    Mon    Tue    Wed
ID                      
ABC  123.0  123.0  123.0
DEF  456.0  456.0  456.0
GHI  789.0  789.0  789.0

EDIT1: Add reindex:

df = (df.drop('Col1', 1)
        .set_index('DAY', append=True)
        .stack()
        .reset_index(level=2, drop=True)
        .unstack()
        .reindex(columns=['Wed','Tue','Mon'])
        )
print (df)
DAY    Wed    Tue    Mon
ID                      
ABC  123.0  123.0  123.0
DEF  456.0  456.0  456.0
GHI  789.0  789.0  789.0

edited Mar 22, 2018 at 7:28

answered Mar 22, 2018 at 6:16

jezrael

868k103 gold badges1.4k silver badges1.3k bronze badges

Sign up to request clarification or add additional context in comments.

18 Comments

Rao Sahab Over a year ago

Really interesting +1

jezrael Over a year ago

@RaoSahab - Thank you.

Singapore 123 Over a year ago

Just realised the dataframe I have at the start is a MultiIndex - how can i remedy that please?

jezrael Over a year ago

@Singapore123 - What is print (df.index.nlevels) ?

Singapore 123 Over a year ago

@jezrael Not too sure either. I made some edits to the original table in the question. Table I'm starting with has a multiindex, vs just single before

|

Collectives™ on Stack Overflow

Pandas dataframe - Rearranging row index values into column headers

1 Answer 1

18 Comments

Your Answer

Hot Network Questions

Collectives™ on Stack Overflow

1 Answer 1

18 Comments

Your Answer

Sign up or log in

Post as a guest

Related