Pandas DataFrame DataFrame.aggregate() Funktion
-
Syntax von
pandas.DataFrame.aggregate() -
Beispiel-Codes: Pandas
DataFrame.agg() -
Beispielcodes:
DataFrame.aggregate()Mit den Mehrfachfunktionen -
Beispielcodes:
DataFrame.aggregate()mit einer spezifizierten Spalte
Die Funktion pandas.DataFrame.aggregate() aggregiert die Spalten oder Zeilen eines DataFrame. Die am häufigsten verwendeten Aggregationsfunktionen sind min, max und sum. Diese Aggregationsfunktionen führen zu einer Verringerung der Größe des DataFrame.
Syntax von pandas.DataFrame.aggregate()
DataFrame.aggregate(func, axis, *args, **kwargs)
Parameter
func |
Es ist die anzuwendende Aggregationsfunktion. Sie kann eine callable oder eine Liste von callable, eine Zeichenkette oder eine Liste von Zeichenketten oder ein Dictionary sein. |
axis |
0 standardmäßig. Ist sie 0 oder 'index', dann wird die Funktion auf die einzelnen Spalten angewendet. Wenn es 1 oder 'columns' ist, wird die Funktion auf die einzelnen Zeilen angewendet. |
*args |
Es ist ein Positionsargument. |
**kwargs |
Es ist ein Stichwortargument. |
Zurück
Diese Funktion gibt einen scalar, eine Series oder einen DataFrame zurück.
- Sie gibt einen
scalarzurück, wenn eine einzelne Funktion mitSeries.agg()aufgerufen wird. - Es gibt eine
Serieszurück, wenn eine einzelne Funktion mitDataFrame.agg()aufgerufen wird. - Es gibt einen
Dataframezurück, wenn mehrere Funktionen mitDataFrame.agg()aufgerufen werden.
Beispiel-Codes: Pandas DataFrame.agg()
DataFrame.agg() ist ein Alias für DataFrame.aggregate(). Es ist besser, den Alias zu verwenden. Daher werden wir DataFrame.agg() in den Beispielcodes verwenden.
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print(dataframe)
Das Beispiel DataFrame befindet sich weiter unten.
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
Wir werden zunächst die Funktion DataFrame.agg() überprüfen, indem wir nur eine einzige Aggregationsfunktion verwenden.
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg("sum")
print(dataframe1)
Ausgabe:
Attendance 413
Name OliviaJohnLauraBenKevin
Obtained Marks 356
dtype: object
Die Aggregationsfunktion sum wird auf die einzelnen Spalten angewendet.
Für eine Spalte vom Typ integer hat sie eine Summe erzeugt; und für eine Spalte vom Typ string hat sie die Zeichenketten verkettet. dtype: object zeigt, dass eine Series zurückgegeben wird.
Beispielcodes: DataFrame.aggregate() Mit den Mehrfachfunktionen
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg(["sum", "min"])
print(dataframe1)
Ausgabe:
Attendance Name Obtained Marks
sum 413 OliviaJohnLauraBenKevin 356
min 60 Ben 45
Die Aggregationsfunktionen sum und min werden auf die einzelnen Spalten angewendet.
Für eine Spalte vom Typ integer hat die Funktion min den minimalen Wert erzeugt, und für eine Spalte vom Typ string hat sie die Zeichenkette mit der minimalen Länge angezeigt.
Beispielcodes: DataFrame.aggregate() mit einer spezifizierten Spalte
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg({"Obtained Marks": "sum"})
print(dataframe1)
Ausgabe:
Obtained Marks 356
dtype: int64
Es wird die Summe einer einzelnen Spalte zurückgegeben. dtype: int64 zeigt, dass diese Funktion eine Series zurückgegeben hat.
Wir könnten auch mehrere Funktionen auf eine einzelne Spalte anwenden.
import pandas as pd
dataframe = pd.DataFrame(
{
"Attendance": {0: 60, 1: 100, 2: 80, 3: 78, 4: 95},
"Name": {0: "Olivia", 1: "John", 2: "Laura", 3: "Ben", 4: "Kevin"},
"Obtained Marks": {0: 90, 1: 75, 2: 82, 3: 64, 4: 45},
}
)
dataframe1 = dataframe.agg({"Obtained Marks": ["sum", "max"]})
print(dataframe1)
Ausgabe:
Obtained Marks
sum 356
max 90